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第 一 课 : 新 建 一 个 窗口 
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欢迎 来 到 第 一 课 ! 


在 学 习 OpenGL 之 前 ， 我 们 将 先 学 习 如 何 生成 ， 运 行 ， 和 玩 转 〈 最 重要 的 一 点 ) 课程 中 的 代码 。 


预 各 知识 


不 需要 特别 的 预 各 知识 。 如 果 你 有 C、Java、Lisp、Javascript 等 编程 语言 的 经 验 ， 那 么 理解 课程 代码 会 更 
快 ; 但 这 不 是 必需 的 ; 如 果 没 有 ， 那 么 也 仅仅 是 同时 学 两 样 东西 (编程 语言 HOpenGL) 会 稍微 复 条 点 而 
Bs 


课程 全 部 用 “傻瓜 式 C++" 编 写 : 我 费 了 很 大 劲 尽量 让 代码 简单 些 。 代 码 里 没有 模板 (template) 、 类 或 指 
针 。 就 是 说 ， 即 使 只 懂 Java， 也 能 理解 所 有 内 容 。 


mia— UJ] 


如 前 面 所 说 ， 我 们 不 需要 预备 知识 ; 但 请 暂时 把 『 老 式 OpenGLJ 先 忘 了 吧 (例如 glBegin0 这 类 东西 ) 。 
在 这 里 ， 你 将 学 习 新 式 OpenGL (OpenGL 3 和 4) ， 而 多 数 网 上 教程 还 在 讲 『 老 式 OpenGLJ」 (OpenGL 1 
和 2) 。 所 以 ， 在 你 的 脑袋 乱 成 一 锅 旷 之前， 把 它们 都 搁 在 一 边 吧 。 


生成 课程 中 的 代码 
所 有 课程 代码 都 能 在 Windows、Linux、 和 Mac 上 生成 ， 而 且 过 程 大 体 相 同 : 


e 更 新 驱动 ! | 赶快 更 新 吧 。 我 可 是 提醒 过 你 哟 。 
e 下 载 C++ 编 译 器 。 

e 安装 CMake 

e 下 载 全 部 课程 代码 

用 CMake 创 建 工 程 

e 编译 工程 

试 试 这 些 例子 ! 


名 平台 的 详细 代码 生成 过 程 将 会 在 后 面 一 一 给 出 ， 不 过 具体 每 个 平台 可 能 会 有 差异 。 如 果 你 不 确定 ， 可 以 
去 看 看 Windows 平 台 的 生成 说 明 ， 然 后 按照 需 改 动 一 下 来 适应 你 目 己 的 平台 。 


在 Windows 平 台 上 生成 课程 代码 


1， 更 新 驱动 应 该 很 轻松 。 让 接 去 NVIDIA 或 者 AMD 的 官网 下 载 。 若 不 清楚 GPU 的 型 号 :控制 面板 -> 系统 和 
安全 -> 系统 -> 设 各 管理 器 -> 显示 适配器 。 如 果 是 Intel 集 成 显卡 ， 一 般 由 电脑 厂商 (Del, HPE) 提供 了 驱 
动 。 


2. 建议 用 Visual Studio 2010 Express 来 编译 。 这 里 可 以 免费 下 载 。 右 嘉 欢 用 MinGW， 推 荐 Qt Creator. 
安装 哪个 都 行 。 下 列 步 骤 是 用 Visual Studio 讲 解 的 ， 其 他 IDE 也 差不多 。 


3， 从 这 里 下 载 安装 CMake. 


4. 下 载 课程 源码 ， 解 压 到 例如 C:/Users/XYZ/Projects/OpenGLTutorials . 


5， 启 动 CMake。 让 第 一 栏 路 径 指 向 刚才 解压 缩 的 文件 夹 ; 耕 不 确定， 就 选 包 含 CMakeLists.txt 的 文件 夹 。 
第 二 栏 ， 填 CMake 输 出 路 径 ( 译 者 注 : 这 里 CMake 输 出 一 个 可 以 在 Visual Studio 中 打开 和 编译 的 工 
程 ) 。 例 如 C:/Users/XYZ/Projects/OpenGLTutorials-build-Visual2010-32bits， 或 者 
C:/Users/XYZ/Projects/OpenGLTutorials/build/Visual2010-32bits。 注 意 ， 此 处 可 随便 填 ， 不 一 定 要 和 
源码 在 同一 文件 夹 。 


[es Jes) 


A CMake 2.8.2 - C:/Users/Armaud/Projects/tutorials-bin-vel0-64 


File |-Iools-| Options Help 

















Where to build the binaries: | C: /Users/Arnaud/Projects/tutorials-bin-vc 10-64 * | Browse Build... 
Search: E] Grouped [E] Advanced | Gif AddEniry | | 3$ Remove Entry 


Name Value 
CMAKE INSTALL, PREFIX C:/Program Files (x86)/Tutorials 


Where is the source code: — Ci/Users/Arnaud/Projects/tutorials 

















Press Configure to update and display new values in red, then press Generate to generate selected build files. 


Generate | Current Generator: Visual Studio 10 Win64 | | 


Confiquring done 
Generating done 





1， 点 击 Configure。 由 于 是 首次 configure 工 程 ，CMake 会 让 你 选择 编译 器 。 根 据 步 又 1 选择 。 如 果 你 的 
Windows 是 64 位 的 ， 选 64 位 。 不 清楚 就 选 32 位 。\ 


2， 再 点 Configure 直 至 红色 行 全 部 消失 。 点 Generate。Visual Studio rA #564. Visual Studio 工 程 创 
建 完 毕 。 不 再 需要 CMake 了 ， 可 以 卸载 掉 。 


3. 打开 C:/Users/XYZ/Projects/OpenGL/Tutorials-build-Visual2010-32bits 会 看 到 Tutorials.sln 文 件 (G44 
注 : 这 下 是 CMake 生 成 的 VS 项 目 文 件 ) ， 用 Visual Studio 打 开 它 。 


| « Local Disk (C: + Users + Arnaud » Projects + tutorials-bin-vcl0-64 + 


Organize ¥ o0 Open * Share with * Burn New folder 


E 


Q. tutorials = Name 


di .hg 

|) build 

5. commen 
e. external 
eji playground 
e tutorialül 
&y tutorial02 
Lt tutorialü3 
eji tutorialü4 
Lt tutorialü5 
La tutorialüG 
5. tutorialü7 
o. tutorialü8 
5. tutorial 


wid tutorials-bin-vcl0-64 


H -mm lo m» 


Tutorials.sin 


on Microsoft Visual Studio Solution Date modified: 28/03/2011 20:19 


本 


[本 tutorialü4 vcxpraj 
tutorialü4 vcxproj.filters 
Fa tutorial0S wexproy 

fe tutorial0S5.vexproy. filters 
I tutorial06.vcxproj 
tutorial06.vcxpraj.filters 
E] tutorial07 vcxproj 

eo tutorial? wexproy filters 
IZ] tutorial08 vexproj 

fad tutorialü8 wexproy filters 
IE] tutorial9.wexproj 

fad tutorial09.wexproy filters 
A Tutorials.sln 

Iz] ZERO, CHECK.vcxproj 


1] ZERO_CHECK.vexproj filters 


State: 2 Shared 


Date modified 


28/03/2011 20:19 
28/03/2011 20:19 
28/03/2011 20:19 
28/03/2011 20:19 
28/03/2011 20:19 
28/03/2011 20:19 
28/03/2011 20:19 
28/03/2011 20:19 
28/03/2011 20:19 
28/03/2011 20:19 
28/03/2011 20:19 
28/03/2011 20:19 
28/03/2011 20:19 
28/03/2011 20:19 
28/03/2011 20:19 


Size: 15,6 KB 


Type 

VC++ Project 
VC++ Project Filte... 
VC++ Project 
VC++ Project Filte... 
VC++ Project 

VC++ Project Filte... 
VC++ Project 
VC++ Project Filte... 
VC++ Project 
VC++ Project Filte... 
VC++ Project 
VC++ Project Filte... 
Microsoft Visual 5... 
VC++ Project 


VC++ Project Filte... 


29 KB 
2 KB 
20 KB 
2 KB 
20 KB 
2 KB 
29 KB 
3 KB 
29 KB 
3 KB 
30 KB 
3 KB 
16 KB 
17 KB 
1 KB 


Shared with: Homegroup 


Date created: 28/03/2011 20:19 





f£ Build 菜单 中 ， 点 Build All。 每 个 课程 代码 和 依赖 项 都 会 被 编译 。 生 成 的 可 执行 文件 会 出 现在 


C:/Users/XYZ/Projects/OpenGLTutorials。 但 愿 不 会 报错 。 


is eee 


(E Ohi men of eee 


erry amm 





1. #7 FFC:/Users/XYZ/Projects/OpenGLTutorials/playground, izfgzplayground.exe, Z&sEHH—^ SAB 
Ll. 








也 可 以 在 Visual Studio 中 运行 任意 一 课 的 代码 ， 但 得 先 设置 工作 目录 : 右键 点 击 Playground， 选 择 
Debugging. Working Directory、Browse， 设 置 路 径 为 
C:/Users/XYZ/Projects/OpenGLTutorials/playground。 验证 一 下 。 再 次 右键 点 击 Playground, "Choose as 
Startup project"。 按 F5 融 可 以 调试 了 。 
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在 Linux 上 生成 
Linux 版 本 众多 ， 这 里 不 可 能 列 出 所 有 的 平台 。 按 需 变 通 一 下 吧 ， 也 不 妨 看 一 下 发 行 版 文档 。 


1， 安 装 最 新 驱动 。 强 烈 推 荐 闭 源 的 二 进 制 驱动 ; 它们 不 开源 ， 但 好 用 。 如 果 发 行 版 不 提供 自动 安装 ， 试 
试 Ubuntu 指 南 . 


2. 安装 全 部 需要 的 编译 器 、 工 具 和 库 。 完 整 清单 如 下 : cmake make g++ libx11-dev libgl1-mesa-dev 
libglu1-mesa-dev libxrandr-dev libxext-dev 。 用 sudo apt-get install * 或 者 su && yum install **。 


3. FEES 并 解压 到 如 —/Projects/OpenGLTutorials/ 


4， 搂 看 输入 如 下 命 分 : 


cd ~/Projects/OpenGLTutorials/ 
mkdir build 

cd build 

cmake .. 


1. build/ 目 录 会 创建 一 个 makefile 文 件 。 


2. 键入 "make all"。 每 个 课程 代码 和 依赖 项 都 会 被 编译 。 生 成 的 可 执行 文件 在 
~/Projects/OpenGLTutorials/。 但 愿 不 会 报错 。 


3. 打开 ~/Projects/OpenGLTutorials/playground， 运 行 ./playground 会 弹出 一 个 黑色 窗口 。 


提示 : 推荐 使 用 Qt Creator 作 为 IDE。 值 得 一 提 的 是 ，Qt Creator 内 置 支 持 CMake， 调 试 起 来 也 顺手 。 如 下 
是 QtCreator 使 用 说 明 : 


1. 在 QtCreator 中 打开 Tools->Options->Compile-&Execute->CMake 
2. 设 置 CMake 路 径 。 很 可 能 像 这 样 /usrWbin/cmake 
3.Flle->Open Project ; 选择 tutorials/CMakeLists.txt 


4. 选 择 生 成 目录 ， 最 好 选择 tutorials 文 件 夹 外 面 


5. 还 可 以 在 参数 栏 中 设置 -DCMAKE_BUILD_TYPE=Debug。 验 证 一 下 。 
6. 点 击 下 面 的 猴子 图 标 。 现 在 教程 可 以 从 tutorials/ 文 件 夹 启 动 了 。 


7. 要 想 在 QtCreator 中 运行 教程 源码 ， 点 击 Projects->Execution parameters->Working Directory， 选 择 着 色 
器 、 纹 理 和 模型 所 在 目录 。 以 第 二 课 为 例 : ~/opengl-tutorial/tutorial02_red_triangle/ 


在 Mac 上 生成 


Mac OS 不 支持 OpenGL 3.3。 最 近 ， 搭 载 MacOS 10.7 Lion 和 兼容 型 GPU 的 Mac 电 脑 可 以 跑 OpenGL 3.2 
了 ， 但 3.3 还 不 行 ; 所 以 我 们 用 2.1 移 植 版 的 课程 代码 。 除 此 外 ， 其 他 步骤 和 Windows 类 似 (也 支持 
Makefiles, Jb A47 SEX) 


1. 从 Mac App Store 安 装 XCode 
2. 下 载 CMake， 安 装 .dmg。 无 需 安装 命令 行 工 具 。 
3. 下 载 课 程 源码 (2.1 版 1 ! ) 解压 到 如 ~/Projects/OpenGLTutorials/ . 


4. 启 动 CMake (Applications->CMake) 。 让 惠 一 栏 路 径 指 向 刚才 解压 缩 的 文件 夹 ， 不 确定 融 选 包含 
CMakeLists.txt 的 文件 来 。 和 第 二 栏 ， 填 CMake 输 出 路 径 。 例 如 ~/Projects/OpenGLTutorials_bin XCode/, È 
意 ， 这 里 可 以 随便 填 ， 不 一 定 要 和 源码 在 同一 文件 夹 。 


5. 点 击 Configure。 由 于 是 首次 configure 工 程 ，CMake 会 让 你 选择 编译 器 。 选 择 Xcode。 


6. 再 点 Configure 直 至 红色 行 全 部 消失 。 点 Generate。Xcode 项 目 创 建 完 毕 。 不 再 需要 CMake 了 ， 可 以 卸 裁 
掉 。 


7. 打 开 ~/Projects/OpenGLTutorials_bin XCode/ 会 看 到 Tutorials.xcodeproj 文 件 : 打开 它 。 


8. 选 择 一 个 教程 ， 在 Xcode 的 Scheme 面板 上 运行 ， 点 击 Run 按 钮 编译 和 运行 : 





Tutorials.xcodeproj 一 |e} tutorial01.cpp 






r3 Finished running tutorialül first window : tutorialQ: 





ly Mac 64-bit 
| Breakmpoin 


mid bi [^3 Tutorials > [ ]Sources ) [ ]tutorialO1 first window ) | ]Source Files > E tutorialO 1. 


Project 648 


" Tutorials // Include standard headers 
' E23 20 targets, Mac OS X SDK 10.6 #include <stdio.h> 
#include <stdlib.h> 
Y [] Sources 
» [-] ALL BUILD // Include GLEW 
(| ZERO. CHECK #include «GL/glew.hs» 
> [C Playground // Include GLFW 
v | tutorialO1 first window &include <GL/glfw.h> 
Y|] Source Files 
eel wt ee heen // Include GLM 
a E #include «glm/glm.hpp» 
7 =| CMakeLists.txt using namespace glm; 
E tutorialO2 red triangle 
> [ tutorialü3 matrices int main( void | 
> [ ]tutorialü4 colored cube // Initialise GLFW 
*-[ ]tutorialüo5 textured cube ifi !qlfwInit() | 


FARRER, RunfZámAX3f. R—-hkASHe Rix bug. AB, ;i&HHCmd-Béz 17; (双击 
源码 文件 夹 /tutorialX/tutorialX， 或 者 通过 终端 ) 。 


关于 Code::Blocks 的 说 明 


由 于 C::B 和 CMake 中 各 有 一 个 bug， 你 得 在 Project->Build->Options->Make commands 中 手动 设置 编译 命 


分 ， 如 下 图 所 示 : 











-=E 

Tutorials A Selected compiler 

-El GNU GCC Compiler - 

x edit cache 

lec ables | “Make” command 

‘arial ake” commands 

» ponia Pre/post build steps | Custom variables 

Su rebuild cach IMPORTANT: These commands are ONLY used when the project is using a custom Makefile, 

+- tutorialO1 fir - -一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 

= tuiterial fir Build project/target: C:/MinGW /bin/mingw32-make.exe -f °C: /Users/Arnaud/Projects /tutorials-bin-CB-32/Makefil 

= tutorial2 re Compile single file: C: MinGW /bin/mingw32-make.exe -f "C: /Users/Arnaud)Projects/tutorials-bin-CB-32/Makefil 

-— tutorial02 re EL IM la IM MEL Ia 

P tutorialO3 m; Clean praject/target: C:/MinGW /bin/mingw32-make.exe -f "C: ua insist ir iiis 

E ——— es Ask if rebuild is needed: 

= tutorialü4 cc 

i- tutorial04 cc Silent build: 

x tutorialü5 te 

+~ tutorial05 te 

+ tutorial06_ke 

+ tutorial06 ke 

t tutorial? m: 


同时 你 还 得 手动 设置 工作 目录 : Project->Properties->Build targets->tutorial N->execution working dir (Bl 
src_dir/tutorial_N/) 。 


运行 课程 例子 
一 定 要 在 正确 的 目录 下 运行 课程 例子 : 你 可 以 双击 可 执行 文件 ; 如 果 受 用 命令 行 ， 请 用 cd 命令 切换 到 正确 
的 目 Ko 


若 想 从 IDE 中 运行 程序 ， 别 忘 了 看 看 上 面 的 说 明 一 一 先 正确 设置 工作 目录 。 
如 何 学 习 本 课程 


每 课 都 附 有 源码 和 数据 ， 可 在 tutorialXX/ 找 到 。 不 过 ， 建 议 您 不 改动 这 些 工程 ， 将 它们 作为 参考 ; 推荐 在 
playground/playground.cpp 中 做 试验 ， 怎 么 折腾 都 行 。 要 是 弄 乱 了 ， 就 去 粘 一 段 课 程 代码 ， 一 切 就 会 恢复 
IE Fo 


我 们 会 在 整个 教程 中 提供 代码 片段 。 不 妨 在 看 教程 时 ， 下 搂 把 它们 复制 到 playground 里 跑 跑 看 。 动手 实 验 
才 是 王道 。 单 纯 看 别人 写 好 的 代码 学 不 了 多 少 。 即 使 仅仅 粘贴 一 下 代码 ， 也 会 碰 到 不 少 问题 。 


A — 


终于 1 写 OpenGL 代 码 的 时 刻 来 了 ! 


吧 ， 其 实 还 早 看 呢 。 有 的 教程 都 会 教 你 以 " 诡 层 "的 方式 做 事 ， 好 让 你 清和 芭 每 一 步 的 原理 。 但 这 往往 很 无 聊 也 
无 用 。 所 以 ， 我 们 用 一 个 外 部 的 库 一 -GLFW 来 帮 有 我 们 义理 窗口 、 键 盘 消 息 等 细节 。 你 也 可 以 使 用 
Windows 的 Win32 API、Linux 的 X11 API， 或 Mac 的 Cocoa API ; 或 者 用 别 的 库 ， 比 如 SFML、 
FreeGLUT、SDL 等 ， 请 参见 链接 页 


我 们 开始 吧 。 从 处 理 依赖 库 开 始 : 我 们 要 用 一 些 基 本 库 ， 在 控制 台 显 示 消 息 : 


// Include standard headers 
#include <stdio.h> 
#include <stdlib.h> 


然后 是 GLEW 库 。 这 东西 的 原理 ， 我 们 以 后 再 说 。 


// Include GLEW. Always include it before gl.h and glfw.h, since it’s a bit magic. 
#include <GL/glew.h> 


3k FAGLFW E POA SHE, IBEX : 


// Include GLFW 
#include <GL/glfw.h> 


下 面 的 GLM 是 个 很 有 用 的 三 维 数学 库 ， 我 们 暂时 没 用 到 ， 但 很 快 就 会 用 上 。GLM 库 很 好 用 ， 但 没有 什么 神 
奇 的 ， 你 自己 也 可 以 写 一 个 。 添 加 “Using namespace” 是 为 了 不 用 写 “glm::vec3”， 直 接 写 “Vec3”。 


// include GLM 
#include <glm/glm.hpp> 
using namespace glm; 


Jr SR dB 3x L#includeabs4 s $llplayground.cpp, RAAR, JLbR P mank. PIELSX419)88— : 


int main(){ 


首先 初始 化 GLFW : 


// Initialise GLFW 

i Leer win ee). 2) 

{ 
fprintf( stderr, "Failed to initialize GLFW\n" ); 
return -1; 
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glfwOpenwindowHint(GLFW FSAA SAMPLES, 4); // 4x antialiasing 
glfwOpenwindowHint(GLFW OPENGL VERSION MAJOR, 3); // We want OpenGL 3.3 
glfwOpenwindowHint(GLFW OPENGL VERSION MINOR, 3); 

glfwOpenwindowHint(GLFW OPENGL PROFILE, GLFW OPENGL CORE PROFILE); //We don't want the ol 


// Open a window and create its OpenGL context 
if( !glfwOpenWindow( 1024, 768, 0,0,0,0, 32,0, GLFW WINDOW ) ) 


i 
fprintf( stderr, "Failed to open GLFW window\n" ); 
glfwTerminate(); 
return -1; 

} 


// Initialize GLEW 
glewExperimental=true; // Needed in core profile 
if (glewInit() != GLEW_OK) { 

fprintf(stderr, "Failed to initialize GLEW\n"); 


return -1; 


glfwSetwindowTitle( "Tutorial 01" ); 
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编译 并 运行 。 一 个 窗口 弹出 后 立即 关闭 了 。 可 不 是 叮 ! 还 没 设置 等 竺 用 户 Esc 按 键 再 天 闭 呢 : 





// Ensure we can capture the escape key being pressed below 
glfwEnable( GLFW STICKY KEYS ); 


do{ 
// Draw nothing, see you in tutorial 2 ! 


// Swap buffers 
glfwSwapBuffers(); 


) // Check if the ESC key was pressed or the window was closed 


while( glfwGetKey( GLFW KEY ESC ) !- GLFW PRESS && 
glfwGetWindowParam( GLFW OPENED ) ); 


ARMs x em | 第 二 课 会 教 大 家 男 三 角形 。 


第 二 课 : 男人 第 一 个 三 角形 
这 将 又 是 一 篇 长 教程 。 
用 OpenGL 3 实现 复杂 的 东西 很 方便 ; 为 此 付出 的 代价 是 ， 男 一 个 简单 的 三 角形 变 得 比较 有 奈 烦 。 


不 要 扎 了 ， 定 期 复制 粘贴 ， 跑 一 下 代码 。 


如 果 程 序 和 启动 时 崩溃 了 ， 人 很 可 能 是 你 从 错误 的 目录 下 运行 了 它 。 请 仔细 地 阅读 第 一 课 中 讲 到 的 如 何 配置 Visual 
Studio! 


顶点 数组 对 象 (VAO) 


你 需要 创建 一 个 顶点 数组 对 象 ， 并 将 它 设 为 当前 对 象 (细节 暂 不 深入 ) 


GLuint VertexArrayID; 
glGenVertexArrays(1, &VertexArrayID); 
glBindVertexArray(VertexArrayID); 


当 窗 口 创建 成 功 后 ( 即 OpenGL 上 下 文 创建 后 ) ， 马 上 做 这 一 步 工作 ; 必须 在 任何 其 他 OpenGL 调 用 前 完 
成 。 

若 想 进一步 了 解 顶点 数组 对 象 (VAO) ， 可 以 参考 其 他 教程 ; 但 这 不 是 很 重要 。 
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三 点 定义 一 个 三 角形 。 当 我 们 在 三 维 图 形 学 中 谈论 “点 (point) "时 ， 我 们 经 前 说 “顶点 (Vertex) ", -Ai 
点 有 三 个 坐标 : X，Y 和 Z。 你 可 以 用 以 下 方式 来 想象 这 三 个 坐标 : 


X 在 你 的 右 方 Y 在 你 的 上 方 Z 是 你 背后 的 方向 〈 是 的 ， 背 后 ， 而 不 是 你 的 前 方 ) 这 里 有 一 个 更 形象 的 方 
法 : 使 用 右手 定 则 


X 是 你 的 拇指 Y 是 你 的 食指 Z 是 你 的 中 指 。 如 果 你 把 你 的 拇指 指向 右边 ， 食 指 指 向 天 空 ， 那 么 中 指 将 指 同 
你 的 背后 。 让 Z 指 往 这 个 方向 很 奇怪 ， 为 什么 要 这 样 呢 ? 简单 的 说 : 因为 基于 右手 定 则 的 坐标 系 航 广 泛 使 
用 了 100 多 年 它 会 给 你 很 多 有 用 的 数学 工具 ; 而 唯一 的 缺点 只 是 Z 方 向 不 直观 。 


补充 : 注意 ， 你 可 以 自由 地 移动 你 的 手 : 你 的 X，Y 和 Z 轴 也 将 跟 看 移动 〈 详 见 后 文 ) 。 


我 们 需要 三 个 三 维 点 来 组 成 一 个 三 角形 ; 现在 开始 : 


// An array of 3 vectors which represents 3 vertices 
static const GLfloat g_vertex_buffer_data[] = { 
qo Of OO 
gn M d Oh Oil, 
op cg on EO 
}; 


第 一 个 顶点 是 (-1, -1, 0)。 


这 意味 着 除非 我 们 以 某 种 方式 变换 它 ， 否 则 它 将 显示 在 屏幕 的 (-1, -1) 位 置 。 什 么 意思 呢 ? 屏幕 的 原点 在 中 


间 ，X 在 右 方 ，Y 在 上 方 。 屏 幕 坐标 如 下 图 : 





该 机 制 内 置 于 显卡 ， 无 法 改变 。 因 此 (-1, -1) 是 屏幕 的 左下 和 角 ，(1, -1) 是 在 下角，(0, 1) 在 中 上 位 置 。 这 个 三 


角形 应 该 占 满 了 大 部 分 屏幕 。 


男 我 们 的 三 角形 


下 一 步 把 这 个 三 角形 传 给 OpenGL。 我 们 通过 创建 一 个 缓冲 区 完成 : 


// This will identify our vertex buffer 


GLuint vertexbuffer; 


// Generate 1 buffer, 


put the resulting identifier in vertexbuffer 


glGenBuffers(1, &vertexbuffer); 


// The following commands will talk about our 'vertexbuffer' buffer 
glBindBuffer(GL_ARRAY_BUFFER, vertexbuffer); 


// Give our vertices to OpenGL. 
glBufferData(GL_ARRAY_BUFFER, sizeof(g_vertex_buffer_data), g_vertex_buffer_data, GL_STAT 


这 只 要 做 一 次 。 














现在 ， 我 们 的 主 循环 中 ， 那 个 之 前 哈 都 没有 的 地 方 ， 就 能 田 我 们 宏伟 的 三 角形 了 : 


// 1rst attribute buffer 
glEnableVertexAttribArray(0); 
glBindBuffer(GL_ARRAY_BUFFER,  vertexbut fer); 


glVertexAttribPointer ( 
0, 
3, 
GL_FLOAT, 
GL_FALSE, 
0, 
(void* )O0 


7 
v7 
ZY 
// 
E 
1 


: vertices 


attribute 0. No particular reason for 0, but must match the lay 
size 

type 

normalized? 

stride 

array buffer offset 


// Draw the triangle ! 
glDrawArrays(GL_TRIANGLES, 0, 3); // Starting from vertex 0; 3 vertices total -> 1 triang 


glDisableVertexAttribArray(9); 
p E E 


结果 如 图 : 
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日 色 略 显 无 聊 。 让 我 们 来 看 看 怎么 把 它 涂 成 红色 。 这 融 需 要 用 到 一 个 叫 『 看 色 器 (Shader) J 的 东西 。 


看 色 器 
ite Bas 


在 最 简单 的 配置 下， 你 将 需要 两 个 着 色 器 : 一 个 叫 顶点 着 色 器 ， 它 将 作用 于 每 个 顶点 上 ; 另 一 个 叫 片 断 
(Fragment) 看 色 器 ， 它 将 作用 于 每 一 个 采样 点 。 我 们 使 用 4 倍 反 走样 ， 因 此 每 像素 有 四 个 采样 点 。 


着 色 器 编程 使 用 GLSL(GL Shader Language，GL 着 色 语 言 )， 它 是 OpenGL 的 一 部 分 。 与 C 或 Java 不 同 ， 
GLSL 必 须 在 运行 时 编译 ， 这 意味 着 每 次 启动 程序 ， 所 有 的 着 色 器 将 重新 编译 。 


这 两 个 着 色 器 通 党 放 在 单独 的 文件 里 。 本 例 中 ， 我 们 有 SimpleFragmentShader.fragmentshader 和 
SimpleVertexShader.vertexshader 两 个 着 色 器 。 他 们 的 扩展 名 是 无 天 紧要 的 ， 可 以 是 .txt 或 者 .glsl。 


以 下 是 代码 。 完 全 理解 它 不 是 很 重要 ， 因 为 通常 一 个 程序 只 做 一 次 ， 看 懂 注 释 就 够 了 。 所 有 其 他 课程 代码 
都 用 到 了 这 个 函数 ， 所 以 它 被 放 在 一 个 单独 的 文件 中 : common/loadShader.cpp。 注 意 ， 和 缓冲 区 一 样 ， 
着 色 器 不 能 直接 访问 : 我 们 仅仅 有 一 个 编号 (ID) 。 真 正 的 实现 隐藏 在 驱动 程序 中 。 


GLuint LoadShaders(const char * vertex file path,const char * fragment_file_path){ 


// Create the shaders 
GLuint VertexShaderID - glCreateShader(GL VERTEX SHADER); 
GLuint FragmentShaderID - glCreateShader(GL FRAGMENT SHADER); 


// Read the Vertex Shader code from the file 

std::string VertexShaderCode; 

std::ifstream VertexShaderStream(vertex file path, std::ios::in); 
if(VertexShaderStream.is open()) 


{ 
Std: string kine = 55 
while(getline(VertexShaderStream, Line) ) 
VertexShaderCode += "\n" + Line; 
VertexShaderStream.close(); 
j 


// Read the Fragment Shader code from the file 
std::string FragmentShaderCode; 
std::ifstream FragmentShaderStream(fragment file path, std::ios::in); 
if (FragmentShaderStream.is_open()){ 
std::string Line: = 9 
while(getline(FragmentShaderStream, Line) ) 
FragmentShaderCode += "\n" + Line; 
FragmentShaderStream.close(); 


GLint Result - GL FALSE; 
int InfoLogLength; 


// Compile Vertex Shader 

printf("Compiling shader : %s\n", vertex file path); 

char const * VertexSourcePointer - VertexShaderCode.c str(); 
glShaderSource(VertexShaderID, 1, &VertexSourcePointer , NULL); 
glCompileShader(VertexShaderID); 


// Check Vertex Shader 

glGetShaderiv(VertexShaderID, GL COMPILE STATUS, &Result); 
glGetShaderiv(VertexShaderID, GL INFO LOG LENGTH, &InfoLogLength); 

std::vector VertexShaderErrorMessage(InfoLogLength); 
glGetShaderInfoLog(VertexShaderID, InfoLogLength, NULL, &VertexShaderErrorMessage[0]) 
fprintf(stdout, "%s\n", &VertexShaderErrorMessage[0]); 


// Compile Fragment Shader 

printf("Compiling shader : %s\n", fragment file path); 

char const * FragmentSourcePointer = FragmentShaderCode.c str(); 
glShaderSource(FragmentShaderID, 1, &FragmentSourcePointer , NULL); 
glCompileShader(FragmentShaderID); 


// Check Fragment Shader 

glGetShaderiv(FragmentShaderID, GL COMPILE STATUS, &Result); 
glGetShaderiv(FragmentShaderID, GL INFO LOG LENGTH, &InfoLogLength); 

std::vector FragmentShaderErrorMessage(InfoLogLength); 
glGetShaderInfoLog(FragmentShaderID, InfoLogLength, NULL, &FragmentShaderErrorMessage 
fprintf(stdout, "%s\n", &FragmentShaderErrorMessage[0]); 


// Link the program 

fprintf(stdout, "Linking programn"); 

GLuint ProgramID = glCreateProgram(); 
glAttachShader(ProgramID, VertexShaderID) ; 
glAttachShader(ProgramID, FragmentShaderID); 
glLinkProgram(ProgramID); 


// Check the program 

glGetProgramiv(ProgramID, GL LINK STATUS, &Result); 

glGetProgramiv(ProgramID, GL INFO LOG LENGTH, &InfoLogLength); 

std::vector ProgramErrorMessage( max(InfoLogLength, int(1)) ); 
glGetProgramInfoLog(ProgramID, InfoLogLength, NULL, &ProgramErrorMessage[9]); 
fprintf(stdout, "%s\n", &ProgramErrorMessage[0]); 


glļDeleteShader (VertexShaderID); 
glDeleteShader(FragmentShaderID); 


return ProgramID ， 





我 们 的 顶点 着色 器 


我 们 先 写 顶 点 着 色 器 。 


第 一 行 告 诉 编译 器 我 们 将 用 OpenGL 3 的 语法 。 


#version 330 core 


第 二 行 声明 输入 数据 : 


layout(location = 0) in vec3 vertexPosition_modelspace; 


具体 解释 一 下 这 一 行 : 


“vec3” 在 GLSL 中 是 一 个 三 维 向 量 。 类 似 于 (但 不 相同 ) 以 前 我 们 用 来 声明 三 角形 的 glm::vec3。 最 重要 的 
是 ， 如 果 我 们 在 C++ 中 使 用 三 维 向 量 ， 那 么 在 GLSL 中 也 使 用 三 维 向 量 。 


“layout(location = 0)" 指 我 们 用 来 赋 给 vertexPosition _modelspace 这 个 属性 的 缓冲 区 。 每 个 顶点 能 有 多 种 属 
性 : 位 置 ， 一 种 或 多 种 颜色 ， 一 个 或 多 个 纹理 坐标 ， 等 等 。OpenGL 不 知道 什么 是 颜色 : 它 只 是 看 到 一 个 
vec3。 因 此 我 们 必须 告诉 它 ， 哪 个 缓冲 对 应 哪个 输入 。 通 过 将 glvertexAttribPointer 函 数 的 第 一 个 参数 值 赋 
给 layout， 我 们 融 完 成 了 这 一 点 。 参 数值 “0" 并 不 重要 ， 它 可 以 是 12 (但 是 不 大 于 
glGetIntegerv(GL_MAX_VERTEX_ATTRIBS, &v)) ; 重要 的 是 两 边 参 数值 保持 一 致 。 
“vertexPosition_modelspace” 这 个 变量 名 你 可 以 任 取 ， 它 将 包含 每 个 顶点 着 色 器 运行 所 需 的 顶点 位 置 值 。 
“in" 的 意思 是 这 是 一 些 输入 数据 。 不 久 我 们 将 会 看 到 “out" 关 键 词 。 


每 个 顶点 都 会 调用 main 画 数 《和 C 语 言 一 样 ) 


void main(){ 


3X8 main Eg 25 E ze RETRO E BSEC A HER PEERS, DORAE D, AMMAR NAH (1,1) , 
那么 三 角形 将 有 一 个 顶点 在 屏幕 的 右上 角 。 在 下 一 课 中 我 们 将 看 到 ， 怎 样 对 输入 位 置 做 一 些 更 有 趣 的 计 
算 。 


gl Position.xyz = vertexPosition modelspace; 


gl_Position.w = 1.0; 


glL_Position 是 为 数 不 多 的 内 置 变量 之 一 : 你 必须 赋 一 个 值 给 它 。 其 他 操作 都 是 可 选 的 ， 我 们 将 在 第 四 课 中 
看 到 “其 他 操作 ” 指 的 是 什么 。 


3x 4183 Fr itz Bae 
作为 我 们 的 第 一 个 片断 着 色 器 ， 我 们 只 做 一 个 简单 的 事 : 设置 每 个 片断 的 颜色 为 红色 。 《〈 记 住 ， 每 像素 有 4 
个 片断 ， 因 为 我 们 用 的 是 4 倍 反 走样 ) 


out vec3 color; 
void main(){ 


color = vec3(1,0,0); 
} 


vec3(1,0,0) 代 表 红 色 。 因 为 在 计算 机 屏幕 上 ， 颜 色 由 红 ， 绿 ， 蓝 这 个 顺序 三 元 组 表示 。 因 此 (1,0,0) 意思 
是 全 红 ， 没 有 绿色 ， 也 没有 蓝 色 。 


把 它们 组 合 起 来 


在 main 循 环 前 ， 调 用 我 们 的 LoadShaders 孙 数 : 


// Create and compile our GLSL program from the shaders 
GLuint programID = LoadShaders( "SimpleVertexShader.vertexshader", "SimpleFragmentShader. 


es 
现在 在 main 循 环 中 ， 首 先 清 屏 : 





glClear(GL _ COLOR BUFFER_BIT | GL_DEPTH_BUFFER_BIT); 


然后 告诉 OpenGL 你 想 用 你 的 着 色 器 : 


// Use our shader 
glUseProgram(programID); 


// Draw triangle... 


… 搂 看 转眼 间 ， 这 束 是 你 的 红色 三 角形 ! 
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下 一 课 中 我 们 将 学 习 变 换 : 如 何 设置 你 的 相机 ， 移 动物 体 等 等 。 


第 三 课 : ABER 
引擎 完全 没有 推动 飞 航 。 飞船 静止 在 原 处 ， 而 引擎 推动 了 环绕 着 飞船 的 宇宙 。 
《 飞 出 个 未 来 》( 一 部 美国 科幻 动画 片 ) 
这 一 课 是 所 有 课程 中 最 重要 的 。 请 至 少 看 八 通 。 
齐 次 坐标 (Homogeneous coordinates) 
目前 为 止 ， 我 们 仍然 把 三 维 顶 点 视 为 三 元 组 (X, y, Zz)。 现 在 引入 一 个 新 的 分 量 W， 得 到 同 量 (x, y, z, W)。 
请 先 记 住 以 下 两 点 〈 稍 后 我 们 会 给 出 解释 ) 
Aw==1, WAS(%, y, z, 1) 为 空间 中 的 点 。 
若 W==0， 则 向 量 (X, y, z, 0) 为 方向 。 
(事实 上 ， 要 永远 记 着 。) 


这 有 什么 不 同 呢 ? 对 于 旋转 ， 二 者 没什么 不 同 。 当 你 旋转 点 和 方 同时 ， 结 果 是 一 样 的。 但 对 于 平移 (将 点 
治 着 某 个 方向 移动 ) ， 情 况 融 不 同 了 。 『 平 移 一 个 方向 」 是 晤 无 意义 的 。 


齐 次 坐标 使 我 们 能 用 同一 个 公式 对 点 和 方向 作 运 算 。 
变换 矩阵 (Transformation matrices) 


矩阵 简介 


简 而 言 之 ， 和 窍 阵 融 是 一 个 行 、 列 数 固定 的 ， 纵 横 排 列 的 数 表 。 比 如 ， 一 个 2x3 起 阵 看 起 来 像 这 样 : 


ED Jy 
9 8 1 


三 维 图 形 学 中 我 们 只 用 到 4x4 和 矩阵 ， 它 能 对 顶点 (x, Y, Z, W) 作 变换 。 这 一 变换 是 用 和 矩阵 左 乘 顶点 来 实现 的 : 
矩阵 x 顶 点 〈 记 住 顺序 ! | 矩阵 左 乘 顶 点 ， 顶 点 用 列 向 量 表 示 ) = 变换 后 的 顶点 

a bed T ax + by + ez + dw 

e fog hl ly] [er fytge+ hw 

i d k l| (a| | ae + py t+ kz + bw 

nm n o p Th m + ny + oz + pw 


这 看 上 去 复杂 ， 实 则 不 然 。 左 手指 着 a， 右 手指 着 x， 得 到 ax。 左手 移 向 右边 一 个 数 p， 右 手 移 向 下 一 个 数 
y， 得 到 by。 依 次 类 推 ， 得 到 cz、dw。 最 后 求 和 ax + by + cz + dW， 就 得 到 了 新 的 x ! 每 一 行 都 这 么 算 下 
去 ， 就 得 到 了 新 的 (x, y, z, WAS. 


这 种 重复 无 聊 的 计算 就 让 计算 机 代劳 吧 。 


用 C++，GLM 表 示 : 


glm::mat4 myMatrix; 

glm::vec4 myVector; 

// fill myMatrix and myVector somehow 

glm::vec4 transformedVector = myMatrix * myVector; // Again, in this order ! this is impo 


ee 


用 GLSL 表 示 : 





mat4 myMatrix; 

vec4 myVector; 

// fill myMatrix and myVector somehow 

vec4 transformedVector = myMatrix * myVector; // Yeah, it's pretty much the same than GLM 


| 


(还 没 把 这 些 复 制 到 你 的 代码 里 跑 跑 吗 ?赶紧 试 试 ) 
平移 矩阵 (Translation matrices) 


平移 矩阵 是 最 简单 易 懂 的 变换 矩 俐 。 平 移 和 矩阵 是 这 样 的 : 


l 

0 1 Z 
0 0 1 

其 中 ，X、Y、Z 是 点 的 位 移 增 量 。 


例如 ， 若 想 把 向 量 (10, 10, 10, 1) 治 X 轴 方向 平移 10 个 单位 ， 可 得 : 


1 o o 10] [10] fi#10+0#*10+0*10+10#1| [10+0+0+410] [20] 
0 10 0|, |10| ]|0*10-1*10-0*10-0*1| ]|0-10-0-0| ]10| 
001 0 10 O*10+0*10+1*10+0*1 0+0+10+0 10 | 
000 1 1 0*10 二 0*10 二 0*10 二 1#1 0+0+041 1 





( 算 算 看 ! 一定 要 动手 算 算 1 |) 


这 样 就 得 到 了 章 次 向 量 (20, 10, 10, 1) ! 记 住 ， 末 尾 的 1 表示 这 是 一 个 点 ， 而 不 是 方向 。 经 过 变换 计算 后 ， 点 
仍然 是 点 ， 很 合理 。 


下 面 来 看 看 ， 对 一 个 代表 Z 轴 负 方 同 的 同 量 ， 作 上 述 平移 变换 会 得 到 什么 结果 : 


mooo fo [1*0--0*0-0*—1210«0] [1+0+0+0] [0] 
010 0| [0| [|0«0-1«0-0*—140*0|  |0—-1-0-0| |0 
00 1 0 -1 0x0+0+0+1+—1+0*0 0--0—1-0 =l 
000 1 0 0*0--0*0--0*—1-- 1*0 0+0+0+0 0 


即 还 是 原来 的 (0, 0, -1, 0) 方 向 ， 这 也 很 合理 ， 正 好 印证 了 前 面 的 结论 : 平移 一 个 方向 是 之 无 意义 的 ”。 
那 怎 么 用 代码 表示 平移 变换 呢 ? 


用 C++，GLM 表 示 : 


#include <glm/transform.hpp> // after <glm/glm.hpp> 


glm::mat4 myMatrix = glm::translate(10,0,0); 
glm::vec4 myVector(10,10,10,0); 
glm::vec4 transformedVector = myMatrix * myVector; // guess the result 


用 GLSL 表 示 : 听 ， 实 际 中 我 们 几乎 不 用 GLSL 做 。 大 多 数 情况 下 在 C++ 代码 中 用 glm::translate() 算 出 和 矩阵 ， 
然后 把 它 传 给 GLSL。 在 GLSL 中 只 做 一 次 乘法 : 


vec4 transformedVector = myMatrix * myVector; 


单位 矩阵 (Identity matrix) 


单位 起 阵 很 特殊 ， 它 什么 也 不 做 。 我 提 到 它 是 因为 ， 知 道 它 和 知道 A*1.0=A 一 样 重要 。 


1 0 0 0 x ler+O«ey+Oe2+04w r+0+0+0 [£ 
0 1 0 0 x | | a Ota+ley+O4et z+O0ew}) |O+y+0+0 y 
() () l () |z| (O*zr+0*žy+l*z+0*+w|]| 10 十 0 二 zz 十 0 z 
ü Q T 1 w 0sxz-4-0xwy--0*xz-J4lsxw 0+0+0+ w tuU 
用 C++ 表示 : 
glm::mat4 myIdentityMatrix = glm::mat4(1.0); 

缩放 矩阵 (Scaling matrices) 
缩放 矩阵 也 很 简单 : 

r 0 0 0 

0 y 0 0 

0 0 z 0 

0 0 0 1 
例如 把 一 个 向 量 〈 点 或 方向 此 可 ) 治 各 方向 放大 2 倍 : 

2 () () () £ 2*2+0ey4+O0424+0 eu Zeor+tO0+0+0 2* x 
0 2 0 0 suc PT = O*xa2+2ey+O0eaz2+0ew) jjo+2ey+04+0)  |2*wy 
() () 2 0 z| |JOexa+Oey+2ez+0ew|) |O+O04+2%2+0] |2>z 
0 0 0 1 w QO*#ae+04ey+O0e24+1Law 0+0+0+1«w Ww 


WwW 还 是 没 变 。 你 也 许 会 问 : “缩放 一 个 向 量 " 有 什么 用 ? ww, KSB FERAHA, BIEL—ÀBRA ARES; 
但 在 某 些 罕见 情况 下 它 就 有 用 了 。 顺便 说 一 下 ， 单 位 矩阵 只 是 缩放 和 矩阵 的 一 个 特例 ， 其 (X, Y, Z) = (1,1, 
1)。 单 位 矩阵 同时 也 是 旋转 和 矩阵 的 一 个 特例 ， 其 (X, Y, Z)=(0, 0, 0)) 。 


用 C++ 表示 : 


// Use #include <glm/gtc/matrix_transform.hpp> and #include <glm/gtx/transform.hpp> 
glm::mat4 myScalingMatrix = glm::scale(2,2,2); 


旋转 矩阵 (Rotation matrices) 


lEPLABREREDBELEDAR. REM, Boy B SH, UGEPTAEADBABRRBUJPIÉST433. 想 了 解 更 多 ， 请 


看 和 矩阵 和 四 元 组 前 见 问题 (这 个 资源 很 热门 ， 应 该 有 中 文 版 吧 ) 。 


用 C++ 表示 : 


// Use #include «glm/gtc/matrix transform.hpp» and #include <glm/gtx/transform.hpp> 
[uo qun" 


glm::vec3 myRotationAxis( ??, 
myRotationAxis ); 


glm::rotate( angle in degrees, 


合 变换 


前 面 已 经 学 习 了 如 何 旋 转 、 平 移 和 缩放 向 量 。 要 是 能 将 它 
可 ， 例 如 : 


已 们 组 合 起 来 焉 更 好 了 。 只 需 把 这 些 息 阵 相 乘 即 


TransformedVector = TranslationMatrix * RotationMatrix * ScaleMatrix * OriginalVector 


| 1 1! 千 万 注意 1 ! 1! 这 行 代 码 最 先 执 行 缩 放 ， 接 看 旋转 ， 最 后 才 是 平移 。 这 融 是 矩阵 乘法 的 工作 方 陈 。 


变换 的 顺序 不 同 ， 得 出 的 结果 也 不 同 。 体 验 一 下 : 


e 向 前 一 步 (Vee EU) 然后 左 转 ; 

e 左 转 ， 然 后 向 前 一 步 

实际 上 ， 上 述 顺序 正 是 你 在 变换 游戏 人 物 或 者 其 他 物体 时 所 需 的 : 先 缩放 ; 再 调整 方向 ; 最 后 平移 。 例 
如 ， 假 设 有 个 舱 的 模型 (Afb, KEHE) 


错误 做 法 : 


e 按 (10, 0, 0) 平 移 舱 体 。 舱 体 中 心目 前 距离 原点 10 个 单位 。 
得 到 一 稻 放 


I 
Ol 
— 
eI 
各 


。 将 舱 体 放大 2 倍 。 以 原点 为 参照 ， 每 个 坐标 都 变 成 原来 的 2 舍 ， 融 出 问题 了 。 .……. EX 
大 的 船 ， 但 其 中 心 位 于 2*10=20。 这 可 不 是 你 想 要 的 结 


正确 做 法 : 
。 将 舱 体 放大 2 倍 ， 得 到 一 般 中 心 位 于 原点 的 大 舱 。 


。 平移 船体 。 船 大 小 不 变 ， 移 动 距离 也 正确 。 


矩阵 -起 阵 乘 法 和 算 阵 - 疝 量 乘法 类 似 ， 所 以 这 里 也 会 省 略 一 些 细 节 ， 不 清 生 的 请 移 步 “ 忠 阵 和 四 元 数 背 见 问 


题 "。 现 在 ， 束 让 计算 机 来 算 : 
用 C++，GLM 表 示 : 


myModelMatrix = myTranslationMatrix * myRotationMatrix * myScaleMatrix; 


glm: :mat4 
myTransformedVector = myModelMatrix * myOriginalVector; 


glm: :vec4 


用 GLSL 表 示 : 


mat4 transform = mat2 * mati; 
vec4 out_vec = transform * in_vec; 


模型 (Model) 、 视 图 (View) 和 投影 (Projection) 和 矩阵 
在 接 下 来 的 课程 中 ， 我 们 假定 已 知 绘制 Blender 经 典 三 维 模 型 : 小 猴 Suzanne 的 方法 。 


利用 模型 、 视 图 和 投影 窍 阵 ， 可 以 将 变换 过 程 清 晰 地 分 解 为 三 个 阶段 。 这 个 方法 你 可 以 不 用 (我 们 在 前 两 
课 融 没 用 ) ， 但 最 好 要 用 。 我 们 即将 看 到 ， 它 们 把 整个 流程 划分 得 很 清楚 ， 故 被 广 为 使 用 。 


E MB E 
这 个 三 维 模 型 ， 和 我 们 心爱 的 红色 三 角形 一 样 ， 是 由 一 组 顶点 定义 的 。 顶 点 的 XYZ 坐 标 是 相对 于 物体 中 心 
定义 的 : EME, AMAF (O, 0, 0)， 它 就 在 物体 的 中 心 。 





也 许 玩家 需要 用 键 鼠 控制 这 个 模型 ， 所 以 我 们 希望 能 够 移动 它 。 这 简单 ， 只 需 学 会 : 缩放 旋转 平移 束 行 
了 。 在 每 一 帧 中 ， 用 算出 的 这 个 矩阵 ， 去 乘 〈 在 GLSL 中 乘 ， 不 是 C++ 中 1 ) 所 有 的 顶点 ， 物 体 就 动 了 。 唯 
一 不 动 的 就 是 世界 坐标 系 (World Space) 的 中 心 。 


现在 ， 物 体 所 有 顶点 都 位 于 世界 坐标 系 。 下 图 中 黑色 箭头 的 意思 是 : 从 模型 坐标 系 (Model Space) (im 
点 都 相对 于 模型 的 中 心 定 义 ) 变换 到 世界 坐标 系 (顶点 都 相对 于 世界 坐标 系 中 心 定义 ) 。 


下 图 概括 了 这 一 过 程 : 


| Model Matrix | 


d, E] B E 





这 里 再 引用 一 下 《 飞 出 个 未 来 》 : 


引擎 完全 没有 推动 飞 租 。 飞 舱 静 止 在 原 多 ， 而 引擎 推动 了 环绕 看 飞 舱 的 于 宙 。 





仔细 想 想 ， 相 机 的 原理 也 是 相通 的 。 如 果 想 换个 角度 观察 一 座 山 ， 你 可 以 移动 相机 也 可 以 ..…... 移 动 山 。 后 
者 在 生活 中 不 可 行 ， 在 计算 机 图 形 学 中 却 十 分 方便 。 


起 初 ， 相 机 位 于 世界 坐标 系 的 原点 。 移 动 世界 只 需 乘 上 一 个 和 矩阵。 假如 你 想 把 相机 向 右 (X 轴 正方 向) 移动 
3 个 单位 ， 这 和 把 整个 世界 〈 包 括 网 格 ) AA 〈《X 轴 负 方 向 ) 移 3 个 单位 是 等 效 的 ! FA REL? RERA : 


// Use #include <glm/gtc/matrix_transform.hpp> and #include <glm/gtx/transform.hpp> 
glm::mat4 ViewMatrix = glm::translate(-3,0,0); 


下 图 展示 了 : 从 世界 坐标 系 (顶点 都 相对 于 世界 坐标 系 中 心 定义 ) 到 观察 坐标 系 (Camera Space， 顶 点 都 
相对 于 相机 定义 ) 的 变换 。 





EARRA, KARA — RGLMt AgIm::LookAtH Avie : 


glm::mat4 CameraMatrix = glm::LookAt( 

cameraPosition, // the position of your camera, in world space 

cameraTarget, // where you want to look at, in world space 

upVector // probably glm::vec3(0,1,0), but (0,-1,0) would make you looking ups 
): 











ee 


TAHAT ERE deu: 









| Model Matrix | 


| view Matrix | 


投影 起 阵 


现在 ， 我 们 处 于 观察 坐标 条 中 。 这 意味 着 ， 经 历 了 这 么 多 变换 后 ， 现 在 一 个 坐标 为 (0,0) 的 顶点 ， 应 该 被 男 
在 屏幕 的 中 心 。 但 公有 Xx、y 坐 标 还 不 足以 确定 物体 是 否 应 该 画 在 屏幕 上 : 它 到 相机 的 距离 (z) 也 很 重要 ! 
两 个 x、y 坐 标 相 同 的 顶点 ，z 值 较 大 的 一 个 将 会 最 终 显示 在 屏幕 上 。 


这 就 是 所 谓 的 透视 投影 (perspective projection) 





好 在 用 一 个 4x4 算 阵 束 能 和 表示 这 个 投影 1 : 


// Generates a really hard-to-read matrix, but a normal, standard 4x4 matrix nonetheless 
glm::mat4 projectionMatrix = glm: :perspective( 
FoV, // The horizontal Field of View, in degrees : the amount of "zoom". Thin 
/ , // Aspect Ratio. Depends on the size of your window. Notice that 4/3 == 
; // Near clipping plane. Keep as big as possible, or you'll get precision 
// Far clipping plane. Keep as little as possible. 





从 观察 坐标 条 (顶点 都 相对 于 相机 定义 ) 到 齐 次 坐标 (Homogeneous Space) (顶点 都 在 一 个 小 立方 体 
中 定义 。 立 方 体内 的 物体 都 会 在 屏幕 上 显示 ) 的 变换 。 


最 后 一 幅 图 示 : 








| Model Matrix | 





| View Matrix | 


| Projection Matrix | 


再 添 几 张 图 ， 以 便 大 家 更 好 地 理解 投影 变换 。 投 影 前 ， 蓝 色 物 体 都 位 于 观察 坐标 条 中 ， 红 色 的 东西 是 相机 
的 视 域 四 棱锥 (frustum) : 这 是 相机 实际 能 看 见 的 区 域 。 





用 投影 矩阵 去 乘 前 面 的 结果 ， 得 到 如 下 效果 : 


zu 


ee 
~ P. 
nm 


pz 
此 图 中 ， 视 域 四 棱锥 变 成 了 一 个 正方 体 〈 每 条 校 的 范围 都 是 -1 到 1， 图 上 不 太 明 显 ) ， 所 有 的 蓝 色 物体 都 经 
过 了 相同 的 形变 。 因 此 ， 离 相机 近 的 物体 融 显 得 大 一 些 ， 远 的 显得 小 一 些 。 和 真实 生活 中 一 样 ! 


让 我 们 从 视 域 四 棱锥 的 “后 面 " 看 看 它们 的 模 祥 : 


1 





这 融 是 你 得 出 的 图 像 了 ! 看 上 去 太 方 方正 正 了 ， 因 此 ， 还 需要 做 一 次 数学 变换 使 之 适合 实际 的 窗口 大 小 : 


768, 





这 就 是 实际 泻 染 的 图 像 啦 | 
复合 变换 : REHAB (MVP) 


… 再 来 一 串 亲 爱 的 矩阵 乘法 : 


// C++ : compute the matrix 

glm::mat3 MVPmatrix = projection * view * model; // Remember : inverted ! 
// GLSL : apply it 

transformed_vertex = MVP * in_vertex; 


Wwe 
Nh- 


第 一 步 : 创建 模型 视图 投影 (MVP) Be. EAR ERREA RO 


// Projection matrix : 45° Field of View, 4:3 ratio, display range : 0.1 unit 100 units 
glm::mat4 Projection = glm::perspective(45.0f, 4.0f / 3.0f, O.1f, 100.0f); 
// Camera matrix 
glm::mat4 View - glm::lookAt( 
glm::vec3(4,3,3), // Camera is at (4,3,3), in World Space 
glm::vec3(0,0,0), // and looks at the origin 
glm::vec3(0,1,0) // Head is up (set to 0,-1,0 to look upside-down) 
); 


// Model matrix : an identity matrix (model will be at the origin) 


glm::mat4 Model = glm::mat4(1.0f); // Changes for each model ! 
// Our ModelViewProjection : multiplication of our 3 matrices 
glm::mat4 MVP = Projection * View * Model; // Remember, matrix multiplication is t 


i 





a] SSS Ee 


az i eee 


第 二 步 : 把 MVP 传 给 GLSL 





// Get a handle for our "MVP" uniform. 
// Only at initialisation time. 
GLuint MatrixID = glGetUniformLocation(programID, "MVP"); 


// Send our transformation to the currently bound shader, 

// in the "MVP" uniform 

// For each model you render, since the MVP will be different (at least the M part) 
glUniformMatrix4fv(MatrixID, 1, GL FALSE, &MVP[0][0]); 


第 三 步 : 在 GLSL 中 用 MVP 变 换 顶 点 


in vec3 vertexPosition_modelspace; 
uniform mat4 MVP; 


void main(){ 


// Output position of the vertex, in clip space : MVP * position 
vec4 v = vec4(vertexPosition_modelspace,1); // Transform an homogeneous 4D vector, re 
gl Position = MVP * v; 

j 


I| m—— ——————]ng—0Ó——. A1 e] 


完成 | 三 角形 和 第 二 课 的 一 样 ， 仍 然 在 原点 (0, 0, 0)， 然 而 是 从 点 (4, 3, 3) 透 视 观 察 的 ; 相机 的 上 方向 为 (0， 
1, 0)， 视 场 角 (field of view) 45°, 
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第 6 课 中 你 会 学 到 怎样 用 键 鼠 动态 修改 这 些 值 ， 从 而 创建 一 个 和 游戏 中 类 似 的 相机 。 但 我 们 会 先 学 给 三 维 模 
型 上 色 〈 第 4 课 ) 、 贴 纹理 (第 5 课 ) 。 


练习 

试 着 蔡 换 glm::perspective 

不 用 透视 投影 ， 试 试 正 交 投影 (orthographic projection ) (glm::ortho) 
把 ModelMatrix 改 成 先 平 移 ， 再 旋转 ， 最 后 放 缩 三 角形 


其 他 不 变 ， 但 把 模型 矩阵 运算 改 成 平移 -旋转 - 放 缩 的 顺序 ， 会 有 什么 变化 ? 如果 对 一 个 人 作 变 换 ， 你 觉得 什 
么 顺序 最 好 呢 ? 


附注 


1:/..J/ 好 在 用 一 个 4x4 和 矩阵 融 能 表示 这 个 投影 : 实际 上 ， 这 句 话 并 不 对 。 透 视 变 换 不 是 优 射 afne) BN, 
因此 ， 租 视 投 影 无 法 完全 由 一 个 矩阵 表示 。 疝 量 和 与 投影 矩阵 相 乘 之 后 ， 它 齐 次 坐标 的 每 个 分 量 都 要 除 以 自 
RAW (透视 除法 ) 。W 分 量 恰好 是 -Z (投影 答 阵 会 保证 这 一 点 ) 。 这 样 ， 离 原点 更 远 的 点 ， 被 除了 较 大 
的 Z 值 ; 其 X、Y 坐 标 变 小 ， 点 与 点 之 间 变 紧 ， 物 体 看 起 来 束 小 了 ， 这 才 产 生 了 透视 效果 。 


第 四 课 : 彩色 立方 体 
欢迎 来 到 第 四 课 | 你 将 学 到 : 


e 男 立 方 体 ， 代 蔡 单 调 的 三 角形 
e 加 上 绚丽 的 色彩 
e 学 习 深度 缓存 (Z-Buffer) 


(eB) Xr 75 1X 


立方 体 有 六 个 方形 表面 ， 而 OpenGL 只 文 持 围 三 角形 ， 因 此 需要 男 12 个 三 角形 ， 每 面 两 个 。 我 们 用 定义 三 
角形 顶点 的 方式 来 定义 这 些 顶 点 。 





// Our vertices. Tree consecutive floats give a 3D vertex; Three consecutive vertices giv 
// A cube has 6 faces with 2 triangles each, so this makes 6*2-12 triangles, and 12*3 ver 
static const GLfloat g vertex buffer data[] = { 
-1.0f,-1.0f,-1.0f, // triangle 1 : begin 
=i, O17, =I, (BT sre ds CF, 

-1.0f, 1.0f, 1.0f, // triangle 1 : end 
1.0f, 1.0f,-1.0f, // triangle 2 : begin 
<i 617, =a. Gir, sil hr. 

-1.0f, 1.0f,-1.0f, // triangle 2 : end 
1.of,-1.0f, 1. 0f, 

=O)? Of =i. Chr, 

irr. ON <li, 

ihe, Of 

LaF. 1 Of -1 0f, 

P dba e o 

A O =r, Oh 

AO Ior oO 

=i (RP 1 Of tl. Che, 

1.0f,-1.0f, 1.0f, 

= (Or, ool, ig, e dl a BRE, 

=O dug d io 

-1.0f, 1.0f, 1.0f, 

-1.0f,-1.0f, 1.0f, 

Of Of Or, 

DO EI of 1 0f, 

Of, -1.0f, -1.0f, 

Of, 1.0b,-1. 9f. 

Ole, Of sibel) ES 

.Of, 1.0f, 1.0f, 

.0f,-1.0f, 1.0f, 

.Of, 1.0f, 1.0f, 

XO OE dps 

"(One Of sak. BT 

1.0f, 1.0f, 1.0f, 

0 d Or, 

She, E dle HE 

1.of, 1-0f, 1.0f, 

-1.0f, 1.0f, 1.0f, 

1.0f, -1.0f，1.0f 


}; 
a E z 


OpenGL 的 缓冲 区 由 一 些 标准 的 函数 (glGenBuffers, glBindBuffer, glBufferData, glVertexAttribPointer) 来 
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创建 、 绑 定 、 填 充 和 配置 ; 这 些 可 参阅 第 二 课 。 绘 制 的 函数 调用 也 没 变 ， 只 需 改 绘制 的 点 的 个 数 : 


// Draw the triangle ! 
glDrawArrays(GL TRIANGLES, 0, 12*3); // 12*3 indices starting at 0 -> 12 triangles -> 6 s 


a EN 


这 段 代码 ， 有 几 点 要 解释 : 





e SEALE, 三维 模 型 都 是 固定 的 : 要 改 束 要 改 源码 ， 重 新 编译 ， 然 后 祈 望 不 会 错 。 我 们 将 在 第 七 课 中 
学 习 如 何 加 载 动态 模型 。 

e 实际 上 ， 每 个 顶点 至 少 个 写 了 三 次 (在 以 上 代码 中 搜索 -1.0f,-1.0f,-1.0f" 看 看 ) . RENNER 
费 。 我 们 将 在 第 九 课 中 学 习 怎 样 优化 。 


现在 ， 你 有 了 男 一 个 日 色 立 方 体 的 所 有 必 各 条 件 。 让 着 色 器 运行 起 来 ， 至 少 试 试 吧 ;) 


添加 颜色 Adding colors 


颜色 ， 从 概念 上 说 ， 像 极 了 位 置 : 它 就 是 数据 。OpenGL 中 ， 它 们 都 是 “属性 "。 事 实 上 ， 之 前 已 在 
glIEnableVertexAttribArray(0 和 glVertexAttribPointer() 用 过 属性 设置 了 。 现 在 我 们 加 上 颜色 属性 ， 代 码 很 相 
似 的 。 


首先 ， 声 明 颜色 : 每 个 顶点 一 个 RGB ( 红 绿 蓝 ) 三 元 组 。 这 里 用 随机 的 方式 生成 的 ， 所 以 结果 可 能 看 起 来 
不 那么 好 ; 但 你 可 以 调整 得 更 好 ， 例 如 : 把 顶点 的 位 置 作 为 颜色 值 。 


// One color for each vertex. They were generated randomly. 
static const GLfloat g color buffer data[] = { 


0.583f, 0.771f, 0.014f, 
0.609f, 0.115f, 0.436f, 
0.327f, 0.483f, 0.844f, 
0.822f, 0.569f, 0.201f, 
0.435f, 0.602f, 0.223f, 
0.310f, 0.747f, 0.185f, 
0.597f, 0.770f, 0.761f, 
0.559f, 0.436f, 0.730f, 
0.359f, 0.583f, 0.152f, 
0.483f, 0.596f, 0.789f, 
0.559f, 0.861f, 0.639f, 
0.195f, 0.548f, 0.859f, 
0.014f, 0.184f, 0.576f, 
0.771f, 0.328f, 0.970f, 
0.406f, 0.615f, 0.116f, 
0.676f, 0.977f, 0.133f, 
0.971f, 0.572f, 0.833f, 
0.140f, 0.616f, 0.489f, 
0.997f, 0.513f, 0.064f, 
0.945f, 0.719f, 0.592f, 
0.543f, 0.021f, 0.978f, 
0.279f, 0.317f, 0.505f, 
0.167f, 0.620f, 0.077f, 
0.347f, 0.857f, 0.137f, 
0.055f, 0.953f, 0.042f, 
0.714f, 0.505f, 0.345f, 
0.783f, 0.290f, 0.734f, 
0.722f, 0.645f, 0.174f, 
0.302f, 0.455f, 0.848f, 
0.225f, 0.587f, 0.040f, 


0.517f, 0.713f, 0.338f, 
0.053f, 0.959f, 0.120f, 
0.393f, 0.621f, 0.362f, 
0.673f, 0.211f, 0.457f, 
0.820f, 0.883f, 0.371f, 
0.982f, 0.099f, 0.879f 
}; 


缓冲 区 的 创建 、 绑 定 和 填充 方法 和 之 前 一 样 : 


GLuint colorbuffer; 

glGenBuffers(1, &colorbuffer); 

glBindBuffer(GL ARRAY BUFFER, colorbuffer); 

glBufferData(GL ARRAY BUFFER, sizeof(g color buffer data), g color buffer data, GL STATIC 

















配置 也 一 样 : 


// 2nd attribute buffer : colors 

glEnableVertexAttribArray(1); 

glBindBuffer(GL ARRAY BUFFER, colorbuffer); 

glVertexAttribPointer( 

1, // attribute. No particular reason for 1, but must match the layout in the shader. 
3, // size 

GL_FLOAT, // type 

GL_FALSE, // normalized? 

0, // stride 

(void*)0 // array buffer offset 


T 


现在 ， 顶 点 着 色 器 中 ， 我 们 已 能 访问 这 个 额外 的 缓冲 区 : 


// Notice that the "1" here equals the "1" in glVertexAttribPointer 
layout(location = 1) in vec3 vertexColor; 


本 例 将 不 会 在 顶点 着 色 器 里 做 花 哈 的 玩意 ， 只 是 简单 地 过 渡 到 片断 着 色 器 : 


// Output data ; will be interpolated for each fragment. 
out vec3 fragmentColor; 


void main(){ 


// The color of each vertex will be interpolated 
// to produce the color of each fragment 
fragmentColor = vertexColor; 


j 


片断 看 色 器 中 ， 要 再 次 声明 片断 颜色 : 


// Interpolated values from the vertex shaders 


in vec3 fragmentColor; 


… 然 后 把 它 的 值 赋 给 输出 颜色 : 


// Output color = color specified in the vertex shader, 
// interpolated between all 3 surrounding vertices 
color = fragmentColor; 


于 是 得 到 : 





a 
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似乎 挺 好 。 现 在 男 " 远 "的 三 角形 : 





它 遮 住 了 *“ 近 "三 角形 ! 它 本 应 该 画 在 “ 近 ” 三 角形 后 面 的 1 我 们 的 立方 体 就 有 这 个 问题 : 一 些 理应 被 遮挡 的 
面 ， 因 为 绘制 时 间 晚 ， 实 际 可 见 。 我 们 将 用 深度 缓存 (Z-Buffer) 算法 解决 它 。 


便签 1 : 如 果 你 没 发 现 问 题 ， 把 相机 放 到 (4,3,-3) 试 试 
便签 2 : 如 果 “ 类 似 于 位 置 ， 产 色 是 一 种 属性 ”， 那 为 什么 颜色 要 声明 vec3 fragmentColor， 而 位 置 不 需要 ? 


实际 上 ， 位 置 有 点 特殊 : 它 是 唯一 必须 赋 初 值 的 《否则 OpenGL 不 知道 在 哪 画 三 角形 ) 。 所 以 在 顶点 着 色 器 
里 ， gl_Position 是 内 置 变量 。 


深度 缓存 (Z-Buffer) The Z-Buffer 


该 问题 的 解决 方案 是 : 在 缓冲 区 中 存储 每 个 片断 的 深度 ( 即 “2" 值 ) ; 而 每 次 画 片 断 时 ， 先 确保 当前 片断 确 
实 比 先前 画 的 片断 更 近 。 


你 可 以 自己 实现 ， 但 让 硬件 自己 去 做 更 简单 : 


// Enable depth test 

glEnable(GL DEPTH TEST); 

// Accept fragment if it closer to the camera than the former one 
glDepthFunc(GL LESS); 


这 融 解 决 之 前 所 有 问题 了 。 
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练习 


。 在 不 同 的 位 置 画 立方 体 和 三 角形 。 你 需要 生成 两 个 MVP 矩 作 ， 在 主 循环 中 做 两 次 绘制 调用 ， 但 只 需 一 
个 着 色 器 。 


e 目 己 生成 颜色 值 。 一 些 提示 : 随机 生成 ， 使 每 次 运行 颜色 都 不 同 ; 依据 顶点 的 位 置 ; 将 前 
或 其 他 的 创新 想法 。 若 你 不 了 解 C， 参 考 以 下 语法 : 


| | 
m 
dis 
Dy 


static GLfloat g color buffer data[12*3*3]; 

for (int SOL v< 12:3; UELUT 
g_color_buffer_data[3*v+0] = your red color here; 
g_color_buffer_data[3*v+1] your green color here; 
g_color_buffer_data[3*v+2] = your blue color here; 


} 


e 完成 上 面 习 题 后 ， 试 令 颜 色 在 每 帧 都 改变 。 你 需要 在 每 一 帧 都 调用 glBufferData。 请 确保 已 先 绑 定 
(glBindBuffer) 了 合适 的 缓冲 区 | 


第 五 课 : 纹理 立方 体 
本 课 学 习 如 下 几 点 : 


e 什么 是 UV 坐标 

e 怎样 自行 加 载 纹 理 

e 怎样 在 OpenGL 中 使 用 纹理 

e 什么 是 滤波 ?什么 是 mipmap ?怎样 使 用 ? 
e 怎样 利用 GLFW 更 加 有 效 地 加 载 纹理 ? 

e 什么 是 alpha 通 道 ? 


关于 UV 坐标 


给 一 个 模型 贴 纹 理 时 ， 需 要 通过 某 种 方式 告诉 OpenGL 用 哪 一 块 图 像 来 填充 三 角形 。 这 是 借助 UV 坐标 来 实 
现 的 。 


每 个 项 点 除了 位 置 坐 标 外 还 有 两 个 浮 点 数 坐标 : U 和 V。 这 两 个 坐标 用 于 获取 纹理 ， 如 下 图 所 示 : 





注意 纹理 是 怎样 在 三 角形 上 扭曲 的 。 


自行 加 载 .BMP 图 片 

了 解 BMP 文 件 格式 并 不 重要 : 很 多 库 可 以 帮 你 做 这 个 。 但 BMP 格式 极为 简单 ， 可 以 帮助 你 理解 那些 库 的 工 
作 原 理 。 所 以 ， 我 们 从 头 开 始 写 一 个 BMP 文件 加 载 器 ， 以 便 你 理解 其 工作 原理 ， 不 过 (在 实际 工程 中 ) F 
万 别 再 用 这 个 实验 品 。 


如 下 是 加 载 玉 数 的 声明 : 


GLuint loadBMP custom(const char * imagepath); 


使 用 方式 如 下 : 


GLuint image = loadBMP custom("./my texture.bmp"); 


接 下 来 看 看 如 何 读 取 BMP 文 件 。 


首先 需要 一 些 数 据 。 读 取 文 件 时 将 设置 这 些 变量 。 


// Data read from the header of the BMP file 

unsigned char header[54]; // Each BMP file begins by a 54-bytes header 
unsigned int dataPos; // Position in the file where the actual data begins 
unsigned int width, height; 

unsigned int imageSize; // = width*height*3 

// Actual RGB data 

unsigned char * data; 


现在 正式 开始 打开 文件 。 


// Open the file 
FILE * file = fopen(imagepath, "rb"); 
if (!file) {printf("Image could not be openedn"); return 0 





El 
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件 头 吧 : 





if ( fread(header, 1, 54, file)!=54 ){ // If not 54 bytes read : problem 
printf("Not a correct BMP filen"); 
return false; 


文件 头 总 是 以 "BM" 开 头 。 实 际 上 ， 如 果 用 十 六 进 制 编辑 器 打开 BMP 文件 ， 你 会 看 到 如 下 情形 : 
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Eb, f&S— TAADF T ENA BAM : 
if ( header[0]!='B' || header[1]!='M' ){ 
printf("Not a correct BMP filen"); 
en (8) 8 
j 


现在 可 以 读 取 文件 中 图 像 大 小 、 数 据 位 置 等 信息 了 : 


// Read ints from the byte array 
dataPos = *(int*)&(header[0x0A]); 
imageSize = *(int*)&(header[0x22]); 


width = *(int*)&(header[0x12]); 
height = *(int* )&( header [0x16] ); 


如 果 这 些 信息 缺失 得 手动 补 齐 


// Some BMP files are misformatted, guess missing information 
if (imageSize--0) imageSize=width*height*3; // 3 : one byte for each Red, Green and Bl 
if (dataPos--0) dataPos=54; // The BMP header is done that way 


"i 一 一 一 





现在 我 们 知道 了 图 像 的 大 小 ， 可 以 为 之 分 配 一 些 内 存 ， 把 图 像 读 进去 : 
// Create a buffer 
data = new unsigned char [imageSize]; 


// Read the actual data from the file into the buffer 
fread(data, 1, imageSize, file); 


//Everything is in memory now, the file can be closed 
fclose(file); 


到 了 真正 的 OpenGL 部 分 了 。 创 建 纹 理 和 创建 顶点 缓冲 器 差不多 : 创建 一 个 纹理 、 绑 定 、 填 充 、 配 置 


— GL_RGB 表 示 颜 色 由 三 个 分 量 构成 ，GL EE 
的 。 实 际 上 ，BMP 存 储 的 并 不 是 RGB， 而 是 BGR， 因 此 得 把 这 个 告诉 OpenGL。 


// Create one OpenGL texture 
GLuint textureID; 
glGenTextures(1, &textureID); 


// "Bind" the newly created texture : all future texture functions will modify this textu 
glBindTexture(GL TEXTURE 2D, textureID); 


// Give the image to OpenGL 
glTexlImage2D(GL TEXTURE 2D, 0,GL RGB, width, height, 0, GL BGR, GL UNSIGNED BYTE, data); 


glTexParameteri(GL TEXTURE 2D, GL TEXTURE MAG FILTER, GL NEAREST); 
glTexParameteri(GL TEXTURE 2D, GL TEXTURE MIN FILTER, GL NEAREST); 
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GLuint Texture = loadBMP custom("uvtemplate.bmp"); 


另外 十 分 重要 的 一 点 : H2 (power-of-two) 的 纹理 | 


e 优质 纹理 : 128128, 256256, 10241024, 2*2... 
e 劣质 纹理 : 127128, 35, ... 
e Fon A) OMB SAAB : 128*256 


在 DpenGL 中 使 用 纹理 


先 来 看 看 片断 看 色 器 。 大 部 分 代码 一 目 了 然 : 


#version 330 core 
// Interpolated values from the vertex shaders 
in vec2 UV; 


// Ouput data 
out vec3 color; 


// Nalues that stay constant for the whole mesh. 
uniform sampler2D myTextureSampler; 


void main(){ 


// Output color = color of the texture at the specified UV 
color = texture( myTextureSampler, UV ).rgb; 


-一 


e 片断 着 色 器 需要 UV 坐标 。 看 似 合 情 合理 。 
e 同时 也 需要 一 个 "Sampler2D" 来 获知 要 加 载 哪 一 个 纹理 〈 同 一 个 着 色 器 中 可 以 访问 多 个 纹理 ) 
e 最 后 一 点 ， 用 texture() 访 问 纹 理 ， 该 方法 返回 一 个 (R,G,B,A) 的 vec4 变 量 。 马 上 融会 了 解 到 分 量 A。 


顶点 着色 器 也 很 简单 ， 只 需 把 UV 坐标 传 给 片断 看 色 器 : 


#version 330 core 

// Input vertex data, different for all executions of this shader. 
layout(location = 0) in vec3 vertexPosition_modelspace; 
layout(location = 1) in vec2 vertexUV; 


// Output data ; will be interpolated for each fragment. 
out vec2 UV; 


// Nalues that stay constant for the whole mesh. 
uniform mat4 MVP; 


void main(){ 


// Output position of the vertex, in clip space : MVP * position 
gl Position = MVP * vec4(vertexPosition modelspace,1); 


// UV of the vertex. No special space for this one. 
UV - vertexUV; 


还 记得 第 四 课 中 的 “layout(location = 1) in vec2 vertexUV" 3 ? RIE a LIPMAN SR m, (Bix 
次 的 缓冲 器 中 放 的 不 是 (R,G,B) 三 元 组 ， 而 是 (U,V) 数 对 。 


// Two UV coordinatesfor each vertex. They were created with Blender. You'll learn shortl 
static const GLfloat g uv buffer data[] = { 
0.000059f, 1.0f-0.000004f, 
.000103f, 1.0f-0.336048f, 
:335973f, 1. 0f- 0.335903f, 
.000023f, 1.0f-0.000013f, 
.667979f, 1.0f-0.335851f, 
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.999958f, 1.0f-0.336064f, 


0 1 
0.667979f, 1.0f-0.335851f, 
0.336024f, 1.0f-0.671877f, 
0.667969f, 1.0f-0.671889f, 
1.000023f, 1.0f-0.000013f, 
0.668104f, 1.0f-0.000013f, 
0.667979f, 1.0f-0.335851f, 
0.000059f, 1.0f-0.000004f, 
0.335973f, 1.0f-0.335903f, 
0.336098f, 1.0f-0.000071f, 
0.667979f, 1.0f-0.335851f, 
0.335973f, 1.0f-0.335903f, 
0.336024f, 1.0f-0.671877f, 
1.000004f, 1.0f-0.671847f, 
0.999958f, 1.0f-0.336064f, 
0.667979f, 1.0f-0.335851f, 
0.668104f, 1.0f-0.000013f, 
0.335973f, 1.0f-0.335903f, 
0.667979f, 1.0f-0.335851f, 
0.335973f, 1.0f-0.335903f, 
0.668104f, 1.0f-0.000013f, 
0.336098f, 1.0f-0.000071f, 
0.000103f, 1.0f-0.336048f, 
0.000004f, 1.0f-0.671870f, 
0.336024f, 1.0f-0.671877f, 
0.000103f, 1.0f-0.336048f, 
0.336024f, 1.0f-0.671877f, 
0.335973f, 1.0f-0.335903f, 
0.667969f, 1.0f-0.671889f, 
1.000004f, 1.0f-0.671847f, 
0.667979f, 1.0f-0.335851f 

I; 

4] 





上 述 UV 坐 标 对 应 于 下 面 的 模型 : 





其 余 的 就 很 清楚 了 。 创 建 一 个 缓冲 器 、 绑 定 、 填 充 、 配 置 ， 与 往常 一 样 绘制 顶点 缓冲 器 对 象 。 要 注意 把 
glVertexAttribPointer 的 第 二 个 参数 (大小) 3 改 成 2。 


结果 如 下 : 





放大 后 : 





什么 是 滤波 和 mipmap ? 怎样 使 用 ? 


正如 在 上 面 规 图 中 看 到 的 ， 纹 理 质 量 不 是 很 好 。 这 是 因为 在 loadBMP_custom 画 效 中 ， 有 两 行 这 样 写 道 : 


glTexParameteri(GL_TEXTURE_2D, GL_TEXTURE_MAG_FILTER, GL_NEAREST); 
glTexParameteri(GL_TEXTURE_2D, GL_TEXTURE_MIN_FILTER, GL_NEAREST); 


这 意味 着 在 片断 着 色 器 中 ，texture() 料 直接 提取 位 于 (U,V) 坐 标的 纹 素 (texel) 。 


各 采用 线性 滤波 。texture() 会 查看 周围 的 纹 素 ， 然 后 根据 UV 坐标 距离 各 纹 素 中 心 的 距离 来 混合 颜色 。 这 融 
避免 了 前 面 看 到 的 锯齿 状 边缘 。 





有 几 种 方法 可 以 改善 这 一 状况 。 


线性 滤波 (Linear filtering) 


m. 





线性 滤波 可 以 显 堵 改善 纹理 质量 ， 应 用 的 也 很 多 。 但 知 想 获得 更 高 质量 的 纹理 ， 可 以 采用 各 癌 异 性 滤波 ， 
不 过 速度 上 有 些 慢 。 


各 向 异性 滤波 (Anisotropic filtering) 


这 种 方法 膛 近 了 真正 片断 中 的 纹 素 区 块 。 例 如 下 图 中 稍 舟 旋转 了 的 纹理 ， 各 回 异 性 滤波 将 治 蓝 色 算 形 框 的 
主 方向 ， 作 一 定数 量 的 采样 〈 即 所 谓 的 “各 向 异性 层级 ") ， 计 算出 其 内 的 颜色 。 


p 





Mipmaps 


线性 滤波 和 各 向 异性 滤波 都 存在 一 个 共同 的 问题 。 那 就 是 如 果 从 远 处 观察 纹理 ， 只 对 4 个 纹 素 作 混合 显得 不 

够 。 实 际 上 ， 如 果 3D 模 型 位 于 很 远 的 地 方 ， eet tail URR) ， 那 计算 平均 值得 出 最 终 颜 

ma 图 像 所 有 的 纹 素 都 应 该 考虑 在 内 。 很 显然 ， 这 样 做 没有 考虑 性 能 问题 。 相 反 ， 人 们 引入 了 mipmap 
一 概念 : 





e 一 开始 ， 把 图 像 缩小 到 原来 的 1/2， 接 着 一 次 做 下 去 ， 直 到 图 像 只 有 1x1 大 小 (应 该 是 图 像 所 有 纹 素 的 
平均 值 ) 

e 绘制 模型 时 ， 根 据 纹 素 大 小 选择 合适 的 mipmap。 

e 可 以 选用 nearest、linear、anisotropic 等 任意 一 种 滤波 方式 来 对 mipmap 采 样 。 

e 要 想 效果 更 好 ， 可 以 对 两 个 mipmap 采 样 然 后 混合 ， 得 出 结果 。 


好 在 这 个 比较 简单 ，OpenGL 都 帮 我 们 做 好 了 ， 只 需 一 个 简单 的 调用 : 


// When MAGnifying the image (no bigger mipmap available), use LINEAR filtering 
glTexParameteri(GL_TEXTURE_2D, GL_TEXTURE_MAG_FILTER, GL_LINEAR); 

// When MINifying the image, use a LINEAR blend of two mipmaps, each filtered LINEARLY to 
glTexParameteri(GL_TEXTURE_2D, GL_TEXTURE_MIN_FILTER, GL_LINEAR_MIPMAP_LINEAR) ; 

// Generate mipmaps, by the way. 

glGenerateMipmap(GL_TEXTURE_2D); 


Aoo YO 
怎样 利用 GLFW 加 载 纹理 ? 


RK i1AloadBMP_customWBiRie, [A 79 3x z& d I1 E] CREE] ! 不 过 用 专门 的 库 更 好 。GLFW 就 可 以 加 载 纹理 
(4x IRTGAX (6t) 


GLuint loadTGA glfw(const char * imagepath) { 


// Create one OpenGL texture 
GLuint textureID; 
glGenTextures(1, &textureID); 


// "Bind" the newly created texture : all future texture functions will modify this t 
glBindTexture(GL TEXTURE 2D, textureID); 


// Read the file, call glTexImage2D with the right parameters 
glfwLoadTexture2D(imagepath, 0); 


// Nice trilinear filtering. 

glTexParameteri(GL TEXTURE 2D, GL TEXTURE WRAP S, GL REPEAT); 
glTexParameteri(GL TEXTURE 2D, GL TEXTURE WRAP T, GL REPEAT); 
glTexParameteri(GL TEXTURE 2D, GL TEXTURE MAG FILTER, GL LINEAR); 
glTexParameteri(GL TEXTURE 2D, GL TEXTURE MIN FILTER, GL LINEAR MIPMAP LINEAR); 
glGenerateMipmap(GL TEXTURE 2D); 


// Return the ID of the texture we just created 
return trexturerD; 





JE Hi DUE 


学 到 这 儿 ， 你 可 能 会 想 怎 样 加 载 JPEG 文 件 而 不 是 TGA 文 件 呢 ? 
简单 的 说 : 别 这 人 么 干 。 还 有 更 好 的 选择 。 
创建 压缩 纹理 

e 下 载 The Compressonator, 一 款 ATI 工 具 


。 用 它 加 载 一 个 二 次 守 纹 理 
e 闻 其 压缩 成 DXT1、DXT3 或 DXT5 格 式 〈 这 些 格式 之 间 的 差别 请 参考 Wikipediay) 


EY TheCompressonator - [uvtemplate.tga - (Mip 2 of 10 (256x256), 100%)] [oS f mJ S | 
eo File Edit View Compress Mip-Levels Tools Window Help 


i | e ec | e | []E ye | | v k? [ATI 30c Compression +|{ Compress | 
| DD Filter + || Generate Mips | | Delete Mips | 


Cr\Users\Arnaud\Projects\tuto...\\uvtemplate.tga | Difference Texture MSE - 2.42 / 0.93 Compressed 


Compress Texture 
Texture Format Channel weighting 


ATIN “4 Aed — 0322223 Fl Adaptive 


名 Ta a SEU eee 
: TA Green 0.333333 | Defaults (RGB) | 
Co ATIZM [Alternate oy Swizzle] 


DATI DXT1 Alpha 
3 DXT3 


RN RN RE à 3! Mo Alpha 


Leia Uze Alpha Channel - Threshold: 128 
2) DXT5 «BR 


2 DATS ABG 
2 DTS ABsG 
| DT 5 RAEG 
Co OTS RGB 
2 DTS «sf 
(C ATC AGE 
ATC RGBA [Explicit Alpha] 
ATC RGBA [Interpolated Alpha] 
( ETC AGE 


man aan Maan Maan aE Ma an Ma an Ma an Ma an Mg ah Mah Mg ah Mg My at 
UM rate CER EEES 


Compression Speed 


(@) Normal [Highest Quality] 


ee a 





XR 








( 5 Fast [Slightly Lower Quality] 


m 


x 


` Super Fast [Lower Quality] 


Abi ai ai ai ai ai ai ai ai 


haaraa aaO 
ae 
^ 
2 
e^ 
2 
^ 
2 


| Compress | | Cancel | 





e 生成 mipmap， 这 样 就 不 用 在 运行 时 生成 mipmap 了 。 
。 导出 为 .DDS 文 件 。 


至 此 ， 图 像 已 压缩 为 可 被 GPU 直接 使 用 的 格式 。 在 着 色 中 随时 调用 texture() 均 可 以 实时 解压 。 这 一 过 程 看 
似 很 慢 ， 但 由 于 它 节省 了 很 多 内 存 空间 ， 传 输 的 数据 量 就 少 了 。 传输 内 存 数 据 开 销 很 大 ; 纹理 解压 缩 却 几 
EARN (有 专门 的 硬件 负责 此 事 ) 。 一 般 情 况 下 ， 才 用 压缩 纹理 可 使 性 能 提升 20%。 


使 用 压缩 纹理 


来 看 看 怎样 加 载 压缩 纹理 。 这 和 加 载 BMP 的 代码 很 相似 ， 只 不 过 文件 头 的 结构 不 一 样 : 


GLuint loadDDS(const char * imagepath) { 
unsigned char header[124]; 
FILE m. 


/* try to open the file */ 
fp - fopen(imagepath, "rb"); 
if (fp -- NULL) 

return 0; 


/* verify the type of file */ 

char filecode[4]; 

fread(filecode, 1, 4, fp); 

if (strncmp(filecode, "DDS ", 4) != 0) 1 


fclose(fp); 
return 0; 


/* get the surface desc */ 
fread(&header, 124, 1, fp); 


unsigned int height = *(unsigned int*)&(header[8 ]); 
unsigned int width = *(unsigned int*)&(header[12]); 
unsigned int linearSize = *(unsigned int*)&(header[16]); 
unsigned int mipMapCount - *(unsigned int*)&(header[24]); 
unsigned int fourCC = *(unsigned int*)&(header[80]); 


文件 头 之 后 是 真正 的 数据 : 紧 接 着 是 mipmap 层 级 。 可 以 一 次 性 批量 地 读 取 : 


unsigned char * buffer; 

unsigned int bufsize; 

/* how big is it going to be including all mipmaps? */ 

bufsize = mipMapCount > 1 ? linearSize * 2 : linearSize; 

buffer = (unsigned char*)malloc(bufsize * sizeof(unsigned char)); 
fread(buffer, 1, bufsize, fp); 

/* close the file pointer */ 

fclose(fp); 


这 里 要 义理 三 种 格式 : DXT1、DXT3 和 DXT5。 我 们 得 把 “fourCC” 标 识 转 换 成 OpenGL 能 识别 的 值 。 


unsigned int components = (fourCC == FOURCC_DXT1) ? 3: 4; 
unsigned int format; 
switch(fourCC) 
i 
case FOURCC DXT41: 
format = GL COMPRESSED RGBA S3TC DXT1 EXT; 
break; 
case FOURCC DXT3: 
format - GL COMPRESSED RGBA S3TC DXT3 EXT; 
break; 
case FOURCC DXT5: 
format = GL COMPRESSED RGBA S3TC DXT5 EXT; 
break; 
default: 
free(buffer); 
return 0; 


RES — HE OSE : 


// Create one OpenGL texture 
GLuint textureID; 
glGenTextures(1, &textureID); 


// "Bind" the newly created texture : all future texture functions will modify this t 
glBindTexture(GL TEXTURE 2D, textureID); 





unsigned int blockSize = (format == GL_COMPRESSED_RGBA_S3TC_DXT1_EXT) ? 8 : 16; 
unsigned int offset = 0; 


/* load the mipmaps */ 
for (unsigned int level = 0; level < mipMapCount && (width || height); ++level) 


{ 
unsigned int size = ((width+3)/4)*((height+3)/4)*blockSize; 
glCompressedTexImage2D(GL_TEXTURE_2D, level, format, width, height, 
©, size, buffer + offset); 


offset += size; 
width /= 2; 
height /= 2; 

j 

free(buffer); 


return texturerD; 


反 转 UV 坐标 


DXT 压 缩 源 自 DirectX。 和 OpenGL 相 比 ，DirectX 中 的 V 纹 理 坐 标 是 反 过 来 的 。 所 以 使 用 压缩 纹理 时 ， 得 用 
(coord.v, 1.0-coord.v) 来 获取 正确 的 纹 素 。 这 步 操 作 何 时 做 都 可 以 : 可 以 在 导出 脚本 中 做 ， 可 以 在 加 载 器 中 
做 ， 也 可 以 在 着 色 器 中 做 .…… 


总 结 
刚刚 学 习 的 是 创建 、 加 载 以 及 在 OpenGL 中 使 用 纹理 。 

总 的 来 说 ， 压 缩 纹理 体积 小 、 加 载 迅速 、 使 用 便捷 ， 应 该 只 用 压缩 纹理 ; 主要 的 缺点 是 得 用 The 
Compressonator 来 转换 图 像 格 式 。 

练习 


e 源 代码 中 实现 了 DDS 加 载 器 ， 但 没有 做 纹理 坐标 的 改动 ( 译 者 注 : 指 文 中 讲述 的 反 转 UV 坐标 ) o E 
当 的 位 置 添加 该 功能 ， 以 使 正方 体 正确 显示 。 

e 试 试 各 种 DDS 格 式 。 所 得 结果 有 何不 同 ? 压缩 率 呢 ? 

e 试 试 在 The Compressonator 不 生成 mipmap。 结 果 如 何 ? 请 给 出 3 种 方案 解决 这 一 问题 。 


参考 文献 


e Using texture compression in OpenGL , Sébastien Domine, NVIDIA 


第 六 课 : 键盘 和 最 标 


欢迎 来 到 第 六 课 ! 


我 们 将 学 习 如 何 通过 鼠标 和 键盘 来 移动 相机 ， 融 像 在 第 一 人 称 射 击 游戏 中 一 样 。 


接口 


这 段 代 码 在 整个 课程 中 多 次 被 使 用 ， E UG eee hee : common/controls.cpp, AREE 
common/controls.hpp 中 声明 函数 接口 ， 这 样 tutorial06.cpp 就 能 使 用 它们 了 。 


和 前 节 课 比 ，tutorial06.cpp 里 的 代码 变动 很 小 。 主 要 的 变化 是 : 每 一 帧 都 计算 MVP (RAMA) FB 
了 嘿 ， 而 不 像 之 前 那样 只 算 一 次 。 现 在 把 这 段 代 码 加 到 主 循环 中 : 


do{ 
TUE 


// Compute the MVP matrix from keyboard and mouse input 
computeMatricesFromInputs(); 

glm::mat4 ProjectionMatrix - getProjectionMatrix(); 
glm::mat4 ViewMatrix - getViewMatrix(); 

glm::mat4 ModelMatrix - glm::mat4(1.0); 

glm::mat4 MVP - ProjectionMatrix * ViewMatrix * ModelMatrix; 


rr ces 


这 段 代 码 需 要 3 个 新 函数 : 


e computeMatricesFromlnputs(0) 读 键盘 和 最 标 操 作 ， 然 后 计算 投影 视图 矩阵 。 这 融 是 奇妙 所 在 。 
e getProjectionMatrix() 返 回 计 算 好 的 投影 矩阵 。 
e getViewMatrix() 返 回 计算 好 的 视图 和 矩阵 。 


这 只 是 一 种 实现 方式 ， 当 然 ， 如 果 你 不 喜欢 这 些 范 数 ， 勇 敢 地 去 改写 它们 。 


来 看 看 controls.cpp 在 做 什么 。 


实际 代码 


我 们 需要 几 个 变量 。 


// position 

glm::vec3 position = glm::vec3( 0, ©, 5 ); 
// horizontal angle : toward -Z 

float horizontalAngle = 3.14f; 

// vertical angle : ©, look at the horizon 
float verticalAngle = 0.0f; 

// Initial Field of View 

float initialFoV = 45.0f; 


float speed = 3.0f; // 3 units / second 
float mouseSpeed = 0.005f; 


FoV is the level of zoom. 80° = very wide angle, huge deformations. 60° - 45° : standard. 
4] -ee ~ 
首先 根据 输入 ， 重 新 计算 位 置 ， 水 平角 ， 竖 直角 和 视 场 角 (FoV) ; 再 由 它们 算出 视图 和 投影 矩阵 。 


AA 





读 取 妃 标 位 置 是 容易 的 : 


// Get mouse position 
int xpos, ypos; 
glfwGetMousePos(&xpos, &ypos); 


我 们 需要 把 光标 放 到 屏幕 中 心 ， 否 则 它 将 很 快 移 到 屏幕 外 ， 导 致 无 法 响应 。 


// Reset mouse position for next frame 
glfwSetMousePos(1024/2, 768/2); 


注意 : 这 段 代码 假设 窗口 大 小 是 1024*768， 这 不 是 必须 的 。 你 可 以 用 glfwGetWindowSize 来 设 定 窗口 大 


AT 


计算 观察 角度 : 


// Compute new orientation 
horizontalAngle += mouseSpeed * deltaTime * float(1024/2 - xpos ); 
verticalAngle += mouseSpeed * deltaTime * float( 768/2 - ypos ); 


从 石 往 左 阅读 这 几 行 代码 : 


e 1024/2 — xpos 表 示 鼠 标 离 窗 口中 心 点 的 距离 。 这 个 值 越 大 ， 转 动 角 越 大 。 

e float(...) 是 浮 点 效 转换 ， 使 乘法 顺利 进行 

e mouseSpeed 用 来 加 速 或 减 慢 旋 转 ， 可 以 随 你 调整 或 让 用 户 选 择 。 

e +=: URI At, 1024/2-xposhy A 7; 3$, horizontalAngle+=0# ck ¥ horizontalAngleBS4&., 40 
RIAN ’=", Ea AAR OF RIA, RMT. 


现在 ， 在 世界 坐标 系 下 计算 一 个 向 量 ， 代 表 视 线 方向 。 


// Direction : Spherical coordinates to Cartesian coordinates conversion 
glm::vec3 direction( 

cos(verticalAngle) * sin(horizontalAngle), 

sin(verticalAngle), 

cos(verticalAngle) * cos(horizontalAngle) 


); 


这 是 一 种 标准 计算 ， 如 果 你 不 了 解 余 弦 和 正弦 ， 下 面 有 一 个 简短 的 解释 : 


tan 





上 面 的 公式 ， 只 是 上 图 在 三 维 空 间 下 的 推广 。 


我 们 想 算出 相机 的 『 上 方向 3〗。 『 上 方向 了 不 一 定 是 Y 轴 正方 向 : 你 俯视 时 ， 『 上 方向 」 实 际 上 是 水 平 的 。 
这 里 有 一 个 例子 ， 位 置 相同 ， 视 点 相同 的 相机 ， 却 有 不 同 的 『 上 方向 」。 


本 例 中 ， 唯 一 不 变 的 是 ，『 相 机 的 右边 这 个 方向 始终 取水 平方 向 。 你 可 以 试 试 : 保持 手臂 水 平 伸 直 ， 向 
正 上 方 看 、 向 下 看 ; 向 这 之 间 的 任何 方向 看 (译注 : TAJ 立刻 产生 视线 方向 ) 。 现 在 定义 rz 向 
量 : 因为 是 水 平 的 ， 故 Y 坐 标 为 需 ，X 和 Z 值 就 像 上 图 中 的 一 样 ， 只 是 角度 旋转 了 90 度 ， 或 Pi/2 弧 度 。 


// Right vector 

glm: :vec3 right = glm::vec3( 
sin(horizontalAngle - 3.14f/2.0f), 
0, 
cos(horizontalAngle - 3.14f/2.0f) 

): 


我 们 有 一 个 『 右 方向 上 」 和 一 个 视线 方向 ， 或 者 说 是 『 前 方向 上 」。 『 上 方向 」 垂直 于 这 两 者 。 一 个 很 有 用 的 
Rcx UE ME EMEN : MAE, 


// Up vector : perpendicular to both direction and right 
glm::vec3 up = glm::cross( right, direction ); 


又 乘 是 在 做 什么 呢 ?很 简单， 回忆 第 三 课 讲 到 的 右手 定 则 。 第 一 个 向 量 是 大 拇指 ; 第 二 个 是 食指 ; 叉 乘 的 
结果 融 是 中 指 。 十 分 方便 。 


位 年 


代码 十 分 直观 。 顺 便 说 下 ， 我 用 上 /下 / 右 / 左 键 而 不 用 wsad ; 是 因为 我 的 azerty 键 盘 中 ， 美 式 键盘 的 awsd 键 
位 处 实际 上 是 zqsd。qwerZ 键 盘 其 实 又 不 一 样 了 ， 更 别提 韩国 键盘 了 。 我 甚至 不 知道 韩国 人 民用 的 键盘 是 
什么 布局 ， 但 我 猜想 肯定 很 不 一 样 。 


// Move forward 

if (glfwGetKey( GLFW KEY UP ) == GLFW PRESS)( 
position += direction * deltaTime * speed; 

j 

// Move backward 

if (glfwGetKey( GLFW KEY DOWN ) == GLFW_PRESS){ 
position -- direction * deltaTime * speed; 

j 

// Strafe right 

if (glfwGetKey( GLFW KEY RIGHT ) == GLFW_PRESS) { 
position += right * deltaTime * speed; 

j 

// Strafe left 


if (glfwGetKey( GLFW KEY LEFT ) == GLFW_PRESS){ 
position -- right * deltaTime * speed; 


j 


这 里 唯一 特别 的 是 deltaTime。 你 不 会 希望 每 帧 偏 移 1 单 元 的 ， 原 因 很 简单 : 


e 如 果 你 有 一 台 快 电 脑 ， 每 秒 
e 如 果 你 有 一 台 慢 电 脑 ， 每 秒 


跑 60 帧 ， 你 每 秒 移动 60*speed 个 单位 。 
跑 20 帧 ， 你 每 秒 移动 20*speed 个 单位 。 


电脑 性 能 不 能 成 为 速度 不 稳 的 借口 ; 你 需要 通过 “前 一 帧 到 现在 的 时 间 ”" 或 "时 间 间 隔 (deltaTime)“" 来 控制 移 
NF Ko 


。 如 果 你 有 一 台 快 电脑 ， 每 秒 
。 如 果 你 有 一 台 慢 电脑 ， 每 秒 


跑 60 帧 ， 你 每 帧 移动 1/60speed 个 单位 ， 每 秒 移动 1speed 个 单位 。 
跑 20 帧 ， 你 每 帧 移动 1/120speed 个 单位 ， 每 秒 移动 1speed 个 单位 。 


这 就 好 多 了 。deltaTime 很 容易 算 : 


double currentTime = glfwGetTime( ); 
float deltaTime = float(currentTime - lastTime); 


视 场 角 


为 了 好 玩 ， 我 们 可 以 把 视 场 角 绑 定 到 鼠标 滚轮 ， 作 为 简陋 的 缩放 功能 : 


float FoV = initialFoV - 5 * glfwGetMouseWheel(); 


计算 和 矩阵 


计算 矩阵 已 经 很 直观 了 。 使 用 和 前 面 几乎 一 祥 的 画 数 ， 仅 参数 不 同 。 


// Projection matrix : 45° Field of View, 4:3 ratio, display range : 0.1 unit <-> 100 uni 
ProjectionMatrix = glm::perspective(FoV, 4.0f / 3.0f, 0.1f, 100.0f); 
// Camera matrix 
ViewMatrix = glm: : LookAt ( 
position, // Camera is here 
position+direction, // and looks here : at the same position, plus "direction" 
up // Head is up (set to 0,-1,0 to look upside-down) 





隐藏 面 消除 


现在 可 以 目 由 移动 电 标 ， 你 会 注意 到 : 如 果 妃 标 移动 到 立方 体 里 面 ， 多 边 形 仍然 会 被 显示 。 这 看 起 来 理 所 
当然 ， 实 则 可 以 优化 。 事 实 上 ， 在 前 见 应 用 中 ， 你 从 来 不 会 处 于 立方 体内 。 


有 一 个 思路 是 让 GPU 检查 相机 在 三 角形 的 后 面 还 是 前 面 。 如 果 在 前 面 ， 显 示 该 三 角形 ; 如 果 相 机 在 三 角形 
后 面 ， 且 不 在 网 格 (网 格 必须 是 封闭 的 ) 内 部 ， 那 么 必 有 其 他 三 角形 在 相机 前 面 ， 故 不 显示 该 三 角形 。 没 
有 人 会 注意 到 什么 ， 除 了 一 切 都 会 变 快 : 三 角形 平均 少 了 两 倍 ! 


更 妙 的 是 ， 检 查 起 来 还 很 简单 : GPU 计算 三 角形 的 法 网 AXR, WEE?) ， 然 后 检查 这 个 法 同 是 否 朝 
向 相机 。 


不 者 的 是 这 样 做 有 代价 : 三 角形 的 方向 是 隐 陈 的 。 这 意味 看 如 果 你 在 缓冲 区 中 交换 两 个 顶点 ， 可 能 会 产 
洞 。 但 一 般 来 说 ， 它 值得 做 一 点 额外 工作 。 一 般 你 只 要 在 三 维 建 模 软 件 中 点 击 “ 反 转 法 向 ”( 实 际 是 交换 两 个 
顶点 ， 从 而 反 转 法 向 ) , DRES T. 


开启 隐藏 面 消 除 是 很 轻松 的 : 


// Cull triangles which normal is not towards the camera 
glEnable(GL CULL FACE); 


练习 


e 限制 verticalAngle， 使 之 不 能 颠倒 方向 

e 创建 一 个 相机 ， 使 它 绕 着 物体 旋转 (position = ObjectCenter + ( radius cos(time), height, radius 
sin(time) ) ) ; 然后 将 半径 /高 度 / 时 间 的 变化 绑 定 到 键盘 /鼠标 上 ， 诸 如 此 类 。 

e 玩 得 开心 ! 


第 七 课 : MMM 
目前 为 止 ， 我 们 一 让 在 硬 编码 手 述 立方 体 。 你 一 定 觉得 这 样 做 很 麻 拙 、 不 方便 。 


本 课 料 学 习 从 文件 中 加 载 3D 模 型 。 和 加 载 纹 理 类 似 ， 我 们 先 写 一 个 小 的 、 功 能 有 限 的 加 载 器 ， 接 着 再 为 大 
家 介绍 几 个 比 我 们 写 的 更 好 的 、 实 用 的 库 。 


为 了 让 课程 尽 可 能 简单 ， 我 们 将 采用 简单 、 常 用 的 OBJ 格 式 。 同 祥 也 是 出 于 简单 原则 ， 我 们 只 义理 每 个 项 
点 有 一 个 UV 坐标 和 一 个 法 向 量 的 OBJ 文 件 (目前 你 不 需要 知道 什么 是 法 向 量 ) 。 


加 载 OBJ 模 型 


加 载 函 数 在 common/objloader.hpp 中 声明 ， 在 common/objloader.cpp 中 实现 。 画 数 原型 如 下 : 


bool loadOBJ( 
const char * path, 
std::vector & out vertices, 
std::vector & out uvs, 
std::vector & out normals 


我 们 让 loadOBJ 读 取 文 件 路 径 ， 把 数据 写 入 out_vertices/out_uvs/out_normals。 如 果 出 错 则 返回 false。 
std::vector 是 C++ 中 的 数组 ， 可 存放 glm::vec3 类 型 的 数据 ， 数 组 大 小 可 任意 修改 ， 不 过 std::vector 和 数学 中 
的 向 量 (vector) 是 两 码 事 。 其 实 它 只 是 个 数组 。 最 后 提 一 点 ， 符 号 & 意 思 是 这 个 函数 将 会 直 搂 修改 这 些 数 
组 。 


OBJ 文 件 示例 


OBJ 文 件 看 起 来 大 概 像 这 样 : 


# Blender3D v249 OBJ File: untitled.blend 
# www.blender3d.org 
mtllib cube.mtl 


v 1.000000 -1.000000 -1.000000 
v 1.000000 -1.000000 1.000000 
v -1.000000 -1.000000 1.000000 
v -1.000000 -1.000000 -1.000000 
v 1.000000 1.000000 -1.000000 
v 0.999999 1.000000 1.000001 

v -1.000000 1.000000 1.000000 
v -1.000000 1.000000 -1.000000 
vt 0.748573 0.750412 

vt 0.749279 0.501284 

VE 0:999110 0.501077 

vt 0.999455 0.750380 

vt 0.250471 0.500702 

vt 0.249682 0.749677 

vt 0.001085 0.750380 

vt 0.001517 0.499994 

vt 0.499422 0.500239 

vt 0.500149 0.750166 

vt 0.748355 0.998230 

VE 0750019307998728 


vt 0.498993 0.250415 

vt 0.748953 0.250920 

vn 0.000000 0.000000 -1.000000 
vn -1.000000 -0.000000 -0.000000 
vn -0.000000 -0.000000 1.000000 
vn -0.000001 0.000000 1.000000 
vn 1.000000 -0.000000 0.000000 
vn 1.000000 0.000000 0.000001 
vn 0.000000 1.000000 -0.000000 
vn -0.000000 -1.000000 0.000000 
usemtl Material ray.png 

off 

Sy by eH es Bay Oe 

5/1/1 4/3/1 8/4/1 

3/5/12 1/6/22 87 1/2 

3/5/2 8/7/2 4/872 

27373767 1073337573 

6/10/4 7/6/4 3/5/4 

172/5 5/17 52/975 

bd DEG OE 976 

571/1 8711/7 6/10/77 

8/11/7 7/12/7 6/10/7 

1/2/8 2/9/8 3/13/8 

1/2/8 3/13/8 4/14/8 


Say eub cub Sh i) SS Sten, ane sur UIS 


因此 : 


。 是 注释 标记 ， 丈 像 C++ 中 的 /| 


e USemtl 和 mtlib 搞 述 了 模型 的 外 观 。 本 课 用 不 到 。 
e V 代 表 顶 点 

e. Vt 代表 顶点 的 纹理 坐标 

e. Vn 代表 顶点 的 法 向 

e f 代 表面 


v vt vn 都 很 好 理解 。f 比 较 厅 烦 。 例 如 f 8/11/7 7/12/7 6/10/7 : 


e 8/11/7 描 述 了 三 角形 的 第 一 个 顶点 

e 7/12/7 摘 述 了 三 角形 的 第 二 个 顶点 

e 6/10/7 描 述 了 三 角形 的 第 三 个 顶点 

e 对 于 第 一 个 顶点 ，8 指 向 要 用 的 顶点 。 此 例 中 是 -1.000000 1.000000 -1.000000 (索引 从 1 开始 ， 和 
C++ 中 从 0 开始 不 同 ) 

e 11 指 向 要 用 的 纹理 坐标 。 此 例 中 是 0.748355 0.998230。 

e 7 指向 要 用 的 法 向 。 此 例 中 是 0.000000 1.000000 -0.000000。 


我 们 称 这 些 数字 为 索引 。 若 几 个 顶点 共用 同一 个 坐标 ， 索 引 束 显得 很 方便 ， 文 件 中 只 需 保存 一 个 VM"， 可 以 
多 次 引用 ， 节 省 了 存储 空间 。 


不 好 的 地 方 在 于 ， 我 们 不 能 让 OpenGL 混 用 顶点 、 纹 理 和 法 向 索引 。 因 此 本 课 采 用 的 方法 是 创建 一 个 标准 
的 、 未 加 索引 的 模型 。 等 第 九 课时 再 讨论 索引 ， 届 时 将 会 介绍 如 何 解决 OpenGL 的 索引 问题 。 


用 Blender 创 建 OBJ 文 件 


我 们 写 的 阁 脚 加 载 器 功能 实在 有 限 ， 因 此 在 导出 模型 时 得 格外 小 心 。 下 图 展示 了 在 Blender 中 有 导出 模型 的 情 
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Operator Presets 


v^ Apply Modifiers 


v^ Include Normals 


«v^ Include UVs 


*' Triangulate Faces 


v” Objects as OB] Objects 


Z Forward 
Y Up 


Auto 





读 取 OBJ 文 件 


OK， 真 正 开 始 编码 了 。 需 要 一 些 临 时 变量 存储 .obj 文 件 的 内 容 。 


std::vector vertexIndices, uvIndices, normalIndices; 
std::vector temp_vertices; 

std::vector temp_uvs; 

std::vector temp_normals; 


学 第 五 课 纹 理 立 方 体 时 ， 你 已 学 会 如 何 打 开 文 件 了 : 


FILE * file = fopen(path, "r"); 

if( file == NULL ){ 
printf("Impossible to open the file !n"); 
return false; 


读 文件 下 到 文件 末尾 : 


while( 1 ){ 


char lineHeader[128]; 
// read the first word of the line 
int res = fscanf(file, "%s", lineHeader); 


if (res == EOF) 
break; // EOF = End Of File. Quit the loop. 


// else : parse lineHeader 


(注意 ， 我 们 假设 第 一 行 的 文字 长 度 不 超过 128， 这 样 做 太 溃 苇 了 。 但 既然 这 只 是 个 实验 品 ， 束 凑合 一 下 
ng) 


首先 处 理 顶 点 : 


if ( strcmp( lineHeader, "v" ) == 0 ){ 
glm::vec3 vertex; 
fscanf(file, "%f %f 96fn", &vertex.x, &vertex.y, &vertex.z ); 
temp_vertices.push_back(vertex); 


也 束 是 说 ， 若 第 一 个 字 是 “V”"， 则 后 面 一 定 是 3 个 float 值 ， 于 是 以 这 3 个 值 创建 一 个 glm::vec3 变 量 ， 将 其 添加 
到 数组 。 


telse if ( strcmp( lineHeader, "vt" ) == © ){ 
glm::vec2 uv; 
fscanf (file, %f %fn", &uv.x, &uv.y ); 
temp_uvs.push_back(uv); 


mei, URAREVMhe vt’, SB —3xExE2Tfloatàü, T zxEDGx27486)$8—^Tglm:vec23 Æ, wl 
到 数组 。 


以 同样 的 方式 处 理 法 向 : 


}else if ( strcmp( lineHeader, "vn" ) == © ){ 
glm::vec3 normal; 
fscanf (file, "%f %f 96fn", &normal.x, &normal.y, &normal.z ); 
temp normals.push back(normal); 


接 下 来 是 f， 略 难 一 些 : 


jelse if ( strcmp( lineHeader, "f" ) == © )( 

std::string vertex1, vertex2, vertex3; 

unsigned int vertexIndex[3], uvindex[3], normalIndex[3]; 

int matches = fscanf(file, "%d/%d/%d %d/%d/%d 96d/96d/96dn", &vertexIndex[0], &uvlIndex[O 

if (matches !- 9)( 
printf("File can't be read by our simple parser : ( Try exporting with other opti 
return false; 

j 

vertexIndices.push back(vertexIndex[O0]); 

vertexIndices.push back(vertexIndex[1]); 

vertexIndices.push back(vertexIndex[2]); 


uvIndices .push back(uvindex[90]); 
uvIndices .push. back(uvindex[1]); 
uvIndices .push. back(uvindex[2]); 


normallIndices.push back(normallIndex[0]); 
normallIndices.push back(normallIndex[1]); 
normallIndices.push back(normallIndex[2]); 





代码 与 前 面 的 类 似 , H^ 过 读 取 的 数据 多 一 些 。 





处 理 数据 


我 们 只 需 改变 一 下 数据 的 形式 。 读 取 的 是 字符 串 ， 现 在 有 了 一 组 数组 。 这 还 不 够 ， 我 们 得 把 数据 组 织 成 
OpenGL 要 求 的 形式 。 也 就 是 去 掉 素 引 ， 只 保留 顶点 坐标 数据 。 这 步 操作 称 为 索引 。 


in FECHA (每 个 中 行 ) 的 每 个 顶点 (每 个 v/vt/vn) 


// For each vertex of each triangle 
for( unsigned int 1=0; i 


顶点 坐标 的 索引 存放 到 vertexlndices[i] : 


unsigned int vertexIndex = vertexIndices[i]; 


因此 坐标 是 temp_vertices[ vertexIndex-1] 〈-1 是 因为 C++ 的 下 标 从 0 开始 ， 而 OBJ 的 索引 从 1 开始 ， 还 记得 
«B ^?) 


glm::vec3 vertex = temp vertices[ vertexIndex-1 ]; 


HMA ST hmm vss : 


out_vertices.push_back(vertex); 


UV 和 法 向 同 理 ， 任 务 完成 ! 


使 用 加 载 的 数据 


到 这 一 步 ， oe unica Gan 这 次 我 们 不 再 声明 一 个 static const GLfloat g vertex buffer data[] = 
{.…}， 而 是 创建 一 个 顶点 数组 (UV 和 法 向 同 理 ) 。 用 正确 的 参数 调用 loadOBJ : 


// Read our .obj file 

std::vector vertices; 

std::vector uvs; 

std::vector normals; // Won't be used at the moment. 
bool res - loadOBJ("cube.obj", vertices, uvs, normals); 


38 EN 28 £5 2 OpenGL : 


glBufferData(GL ARRAY BUFFER, vertices.size() * sizeof(glm::vec3), &vertices[0], GL STATI 











E 


不 好 意思 ， 纹 理 不 好 看 。 我 不 太 擅 长 美工 。 欢 迎 您 来 提供 一 些 好 的 纹理 。 


其 他 模型 格式 及 加 载 器 


这 个 小 巧 的 加 载 器 应 该 比较 适合 初学 ， 不 过 别 在 实际 中 使 用 它 。 参 考 一 下 实用 链接 和 工具 页 面 ， 看 看 有 什 
么 能 用 的 。 不 过 请 注意 ， 等 到 第 九 课 才 会 真正 用 到 这 些 工 具 。 


第 八 课 : 基础 光照 模型 


在 第 八 课 中 ， 我 们 将 学 习 光 照 模 型 的 基础 知识 。 包 括 : 


。 物体 离 光源 越 近 会 越 亮 

。 直 视 反射 光 时 会 有 高 亮 (镜面 反射 ) 

。 当 光 没有 直接 照射 物体 时 ， 物 体会 更 暗 漫 反射 ) 
。 用 环境 光 简 化 计算 


不 包括 : 


e 阴影 。 这 是 个 宽阔 的 主题 ， 大 到 需要 专题 教程 了 。 

e 类 镜面 反射 (包括 水 ) 

e 任何 复杂 的 光 与 物质 的 相互 作用 ， 像 次 表面 散射 (比如 蜡 ) 
各 向 异性 材料 (比如 拉丝 的 金属 ) 

追求 真实 感 的 ， 基 于 物理 的 光照 模型 

Kips CANES aS) 

e 颜色 浴 出 (一 块 红色 的 地 牧 会 映 得 白色 天 花 板 带 红 色 ) 

e SARE 

任何 种 类 的 全 局 光照 ( 它 包 括 了 上 面 的 所 有 ) 


总 而 言 之 : 只 讲 基 础 。 


法 加 
过 去 的 几 个 教程 中 我 们 一 直 在 处 理 法 向 ， 但 是 并 不 知道 法 向 到 底 是 什么 。 
— f8JE II 


一 个 平面 的 法 向 是 一 个 长 度 为 1 并 且 垂 直 于 这 个 平面 的 向 量 。 
ni 角形 两 条 边 进 行 又 乘 计算 
(向 量 a 和 b 的 又 乘 结果 是 一 个 同时 垂直 于 a 和 b 的 向 量 ， 记 得 ? ) ， 然 后 为 一 化 : 使 长 度 为 L。 伪 代码 如 下 : 


triangle ( v1, v2, V3 ) 

edge1 = v2-v1 

edge2 = v3-v1 

triangle.normal = cross(edge1, edge2).normalize() 


A^ 2 434 Al (normal) #lnormalize) K0 A., Normalize0 HAE Oaa (任意 向 量 ， 不 一 定 必须 是 
normal) 除 以 其 基 度 ， 从 而 使 新 长 度 为 1L。 法 向 (normal) 则 是 某 一 类 向 量 的 名 字 。 


顶点 法 问 
引申 开 来 : 顶点 的 法 向 ， 是 包含 该 顶点 的 所 有 三 角形 的 法 向 的 均值 。 这 很 方便 一 一 因为 在 顶点 着 色 器 中 ， 
我 们 义理 顶点 ， 而 不 是 三 角形 ; 所 以 在 顶点 处 有 信息 是 很 好 的 。 并 且 在 OpenGL 中 ， 我 们 没有 任何 办 法 获得 


三 角形 信息 。 伪 代码 如 下 : 


vertex vi, V2; V3; 
triangle tr1, tr2, tr3 // all share vertex wa 


vi.normal = normalize( tri.normal + tr2.normal + tr3.normal ) 


在 OpenGL 中 使 用 顶点 法 辣 


在 OpenGL 中 使 用 法 向 很 简单 。 法 向 是 顶点 的 属性 ， 就 像 位 置 ， 颜 色 ，UV 坐 标 等 一 样 ; 按 义理 其 他 属性 的 
方式 义理 即 可 。 第 七 课 的 loadOBJ 国 数 已 经 将 它们 从 OBJ 文 件 中 读 出 来 了 。 


GLuint normalbuffer; 

glGenBuffers(1, &normalbuffer); 

glBindBuffer(GL ARRAY BUFFER, normalbuffer); 

glBufferData(GL ARRAY BUFFER, normals.size() * sizeof(glm::vec3), &normals[0O0], GL STATIC 





// 8rd attribute buffer : normals 
glEnableVertexAttribArray(2); 
glBindBuffer(GL ARRAY BUFFER, normalbuffer); 
glVertexAttribPointer( 


25 // attribute 

oF // size 

GL FLOAT, // type 

GL FALSE, // normalized? 

O, // stride 

(void*)O // array buffer offset 


a 


有 这 些 准备 就 可 以 开始 了 。 
漫 反 射 部 分 
表面 法 向 的 重要 性 


当 光 源 照 射 一 个 物体 ， 其 中 重要 的 一 部 分 光 向 各 个 方向 反射 。 这 就 是 “ 漫 反射 分 量 "。 (我 们 不 久 将 会 看 到 光 
的 其 他 部 分 去 哪里 了 ) 





当 一 定量 的 光线 到 达 某 表面 ， 该 表面 根据 光 到 达 时 的 角度 而 不 同 程度 地 人 饭 照 腕 。 


如 果 光 线 垂 直 于 表面 ， 它 会 聚 在 一 小 片 表 面 上 。 如 果 它 以 一 个 倾斜 角 到 达 表 面 ， 相 同 的 强度 光照 亮 更 大 一 
片 表 面 : 





这 意味 着 在 斜 射 下 ， 表 面 的 点 会 较 黑 (但 是 记 住 ， 更 多 的 点 会 锌 照射 到 ， 总 光 强 度 仍然 是 一 样 的 ) 


也 惑 是 说 ， 当 计算 像 磁 的 颜色 时 ， 入 射 光 和 表面 法 向 的 夹 角 很 重要 。 因 此 有 : 


// Cosine of the angle between the normal and the light direction, 
// clamped above 0 

// - light is at the vertical of the triangle -> 1 

// - light is perpendicular to the triangle -> 0 

float cosTheta = dot( n,1 ); 


color = LightColor * cosTheta; 


在 这 段 代码 中 ，n 是 表面 法 向 ，| 是 从 表面 到 光源 的 单位 向 量 (和 光线 方向 相反 。 虽然 不 直观 ， 但 能 简化 数学 
计算 ) 。 


SN 一 
XE fi 


N 


求 cosTheta 的 公式 有 漏洞 。 如 果 光 源 在 三 角形 后 面 ，n 和 | 方向 相反 ， 那 么 n.l 是 负 值 。 这 意味 着 colour= 一 个 
负数 ， 没 有 意义 。 因 此 这 种 情况 须 用 clamp(O 将 cosTheta 赋 值 为 0 : 


// Cosine of the angle between the normal and the light direction, 
// clamped above 0 


// - light is at the vertical of the triangle -> 1 
// - light is perpendicular to the triangle -> 0 
// - light is behind the triangle -> 0 

float cosTheta - clamp( dot( n,l ), 0,1 ); 


color - LightColor * cosTheta; 


材质 颜色 


当然 ， 输 出 颜色 也 依赖 于 材质 颜色 。 在 这 幅 图 像 中 ， 日 光 由 绿 、 红 、 蓝 光 组 成 。 当 光 碰 到 红色 材质 时 ， 绿 
光 和 蓝光 被 吸收 ， 只 有 红 光 保留 





我 们 可 以 通过 一 个 简单 的 乘法 来 模拟 : 


color = MaterialDiffuseColor * LightColor * cosTheta; 


模拟 光源 
首先 假设 在 空间 中 有 一 个 点 光源 ， 它 向 所 有 方向 发 射 光 线 ， 像 暴 烛 一 样 。 


对 于 该 光源 ， 我 们 的 表面 收 到 的 光 通 量 依 赖 于 表面 到 光源 的 距离 : 越 远 光 越 少 。 实 际 上 ， 光 通 量 与 距离 的 
平方 成 反比 : 


color = MaterialDiffuseColor * LightColor * cosTheta / (distance*distance); 


最 后 ， 需要 另 一 个 参数 来 控制 光 的 强度 。 它 可 以 被 编码 到 LightColor 中 (将 在 随后 的 课程 中 讲 到 ) ， 但 是 现 
在 暂且 只 一 个 颜色 值 WAS) 和 一 个 强度 (如 60 瓦 ) 。 


color = MaterialDiffuseColor * LightColor * LightPower * cosTheta / (distance*distance) ; 
EE) 
组 合 在 一 起 


为 了 让 这 段 代码 运行 ， 需 要 一 些 参数 (各 种 颜色 和 强度 ) 和 更 多 代码 。 


MaterialDiffuseColor fj 3 3 AA Zx 38 rh 3 BY, 
LightColor 和 LightPower 通 过 GLSL 的 uniform 变 量 在 着 色 器 中 设置 。 


cosTheta 由 n 和 | 决定 。 我 们 可 以 在 任意 坐标 系 中 表示 它们 ， 因 为 都 是 一 样 的 。 这 里 选 相机 坐标 条 ， 是 因为 
它 计 算 光 源 位 置 简单 : 


// Normal of the computed fragment, in camera space 

vec3 n = normalize( Normal_cameraspace ); 

// Direction of the light (from the fragment to the light) 
vec3 l = normalize( LightDirection_cameraspace ); 


Normal_cameraspace 和 LightDirection_cameraspace 在 顶点 着 色 器 中 计算 ， 然 后 传 给 片断 着 色 器 : 


// Output position of the vertex, in clip space : MVP * position 
gl Position = MVP * vec4(vertexPosition modelspace,1); 


// Position of the vertex, in worldspace : M * position 
Position_worldspace = (M * vec4(vertexPosition_modelspace,1)).xyz; 


// Vector that goes from the vertex to the camera, in camera space. 

// In camera space, the camera is at the origin (0,0,0). 

vec3 vertexPosition_cameraspace = (V * M * vec4(vertexPosition_modelspace,1)).xyz; 
EyeDirection cameraspace - vec3(0,0,0) - vertexPosition cameraspace; 


// Nector that goes from the vertex to the light, in camera space. M is ommited because i 
vec3 LightPosition cameraspace = ( V * vec4(LightPosition_worldspace,1)).xyz; 
LightDirection cameraspace = LightPosition cameraspace + EyeDirection cameraspace; 


// Normal of the the vertex, in camera space 
Normal cameraspace = ( V * M * vecA(vertexNormal modelspace,0)).xyz; // Only correct if M 


= 一 一 


这 段 代 码 看 起 来 很 牛 ， 但 它 融 是 在 第 三 课 中 学 到 的 未 西 : OE. STASRAN, BRA TREN A 
名 ， 这 样 在 跟 踩 时 更 简单 。 你 也 应 该 这 样 做 。 





M 和 V 分 别 是 模型 和 视图 答 阵 ， 并 且 是 用 与 MVP 完 全 相同 的 方式 传 给 着 色 器 。 
运行 时 间 

现在 有 了 编写 漫 反 射 光源 的 一 切 必要 条 件 。 向 前 吧 ， 刻 苦 努 力 地 尝试 O 
结 来 


只 包含 漫 反 射 分 量 时 ， 我 们 得 到 以 下 结果 (RATAN AHIR) 





y 
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这 次 结果 比 之 前 好 ， 但 感觉 仍 少 了 一 些 东 西 。 特 别 地 ，Suzanne 的 背后 完全 是 黑色 的 ， 因 为 我 们 使 用 
clamp()。 


环境 光 分 量 


环境 光 分 量 是 最 华丽 的 优化 。 


Itt 


C 


我 们 期 诗 的 是 Suzanne 的 育 后 有 一 点 宛 度 ， 因 为 在 现实 生活 中 灯光 会 照 ? 
弱 地 ) 照 玩 物体 的 背后 。 


它 背 后 的 墙 ， 而 墙 会 反 过 来 ( 微 


(A+ RCNA AA. 
因此 通 弟 可 以 简单 地 做 点 假 光 源 取 巧 。 实 际 上 ， 下 接 让 三 维 模型 发 光 ， 使 它 看 起 来 不 是 完全 黑 即 可 。 


可 这 样 完 成 : 


vec3 MaterialAmbientColor = vec3(0.1,0.1,0.1) * MaterialDiffuseColor; 


color - 

// Ambient : simulates indirect lighting 

MaterialAmbientColor + 

// Diffuse : "color" of the object 

MaterialDiffuseColor * LightColor * LightPower * cosTheta / (distance*distance) 


I 


来 看 看 它 的 结 


结 末 





好 的 ， 效 果 更 好 些 了 。 如 果 要 更 好 的 结果 ， 可 以 调整 (0.1, 0.1, 0.1) 值 。 
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镜面 反射 分 量 


反射 光 的 剩余 部 分 融 是 镜面 反射 分 量 。 这 部 分 的 光 在 表面 有 确定 的 反射 方 同 。 





如 图 所 示 ， 它 形成 一 种 波 凡 。 在 极 疹 的 情况 下 ， 漫 反射 分 量 可 以 为 需 ， 这 样 波 瓣 非 间 非 前 猎 《〈 所 有 的 光 从 
一 个 方向 反射 ) ， 这 融 是 镜子 。 


(的 确 可 以 调整 参数 值 ， 得 到 镜面 ; 但 这 个 例子 中 ， 镜 面 唯一 反射 的 只 有 光源 ， 温 染 结 果 看 起 来 会 很 奇怪 ) 


// Eye vector (towards the camera) 
vec3 E = normalize(EyeDirection cameraspace); 


// Direction in which the triangle reflects the light 

vec3 R = reflect(-1,n); 

// Cosine of the angle between the Eye vector and the Reflect vector, 
// clamped to 0 

// - Looking into the reflection -> 1 

// - Looking elsewhere -> < 1 

float cosAlpha = clamp( dot( E,R ), 0,1 ); 


color - 
// Ambient : simulates indirect lighting 
MaterialAmbientColor + 
// Diffuse : "color" of the object 
MaterialDiffuseColor * LightColor * LightPower * cosTheta / (distance*distance) ; 
// Specular : reflective highlight, like a mirror 
MaterialSpecularColor * LightColor * LightPower * pow(cosAlpha,5) / (distance*distanc 


| ——————————— EI —À1as] 


R 是 反射 光 的 方向 ，E 是 视线 的 反方 向 (HRCA VAR) ; 如 果 二 者 夹 角 很 小 ， 意 味 着 视线 与 反射 光 
线 里 合 





pow(cosAlpha,5) 用 来 控制 镜面 反射 的 波 闪 。 可 以 增 大 5 来 获得 更 大 的 波 交 。 
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注意 到 镜面 反射 使 蜡 子 和 眉毛 更 腕 。 


个 光照 模型 因为 简单 ， 已 被 使 用 了 很 多 年 。 但 它 有 一 些 问题 ， 所 以 被 microfacet BRDF 之 类 的 基于 物理 的 
后 面料 会 讲 到 。 


在 下 节 课 中 ， 我 们 将 学 习 怎 么 提高 VBO 的 性 能 。 将 是 第 一 节 中 级 课程 ! 


第 九 课 : VBO3RHI 


索引 的 原理 





目前 为 止 ， 建 立 VBO 时 我 们 总 是 重复 存储 一 些 共享 的 顶点 和 边 。 
本 课 料 介绍 索引 技术 。 借 助 琳 引 ， 我 们 可 以 重复 使 用 一 个 顶点 。 这 是 用 这 引 缓冲 区 (index buffer) 来 实现 
的 。 
Without indexing With indexing 
v3 (1,2) 5í(32 
v2 (1,2) de v2 a v3 
| v4 (2,0) v1 
vO (0.0] v1 (2,0) vO vi 
[0,0, 2,0, ae. 12, 2,0, 3,2] [0,1 TA ai 13] 
x l Sf \ 
[| 
Vertices 
reused 
twice 
末 引 缓冲 区 存储 的 是 整数 ; SREBMA=TEBASS|, ARSIM AMERRE HK nme. B 
色 、UV 坐 标 、 其 他 UV 坐标 、 法 向 缓冲 区 等 ) 中 找到 顶点 的 信息 。 这 有 点 像 OBJ 文 件 格式 ， 但 有 一 点 相差 其 
远 : 索引 缓冲 区 只 有 一 个 。 这 意味 着 在 两 个 三 角形 共用 一 个 顶点 ， 那 这 个 项 点 的 所 有 属性 对 两 个 三 角形 来 
说 都 是 一 样 的 。 
共享 vs 分 开 


来 看 看 法 向 的 例子 。 下 图 中 ， 艺 术 家 创建 了 两 个 三 角形 ， 试 图 模拟 一 个 平滑 曲面 。 可 以 把 两 个 三 角形 的 法 
同 融 合成 一 个 顶点 的 法 向 。 为 方便 观看 ， 我 国 了 一 条 红线 表示 平滑 曲面 。 





FATTER IAA, SAB eee”, AR SAA, Paha bas kal lw Sih 
值 ， 生 成 一 个 平滑 的 表面 : 





因此 在 这 种 情况 下 ， 把 顶点 的 法 向 分 开 存储 反而 更 好 ; 在 OpenGL 中 ， 唯 一 实现 方法 是 : 把 顶点 连同 其 属性 


完整 复制 一 份 。 


Two separate vertices 
with different normals 


r ; 





OpenGL 中 的 索引 VBO 


索引 的 用 法 很 简单 。 首 先 ， 需 要 创建 一 个 额外 的 缓冲 区 存放 索引 。 代 码 与 之 前 一 样 ， 不 过 参数 
是 ELEMENT ARRAY BUFFER ， 而 非 ARRAY BUFFER 。 


std::vector«unsigned int» indices; 


// fill "indices" as needed 


// Generate a buffer for the indices 

GLuint elementbuffer; 

glGenBuffers(1, &elementbuffer); 

glBindBuffer(GL ELEMENT ARRAY BUFFER, elementbuffer); 
glBufferData(GL ELEMENT ARRAY BUFFER, indices.size() * sizeof(unsigned int), &indice 


T 一 一 一 





只 需 把 glprawArrays 和 蔡 换 为 如 下 语句 ， 即 可 绘制 模型 : 


// Index buffer 
glBindBuffer(GL ELEMENT ARRAY BUFFER, elementbuffer ) ; 


// Draw the triangles ! 


glDrawElements( 
GL TRIANGLES, // mode 
indices.size(), 77 QUE 
GL UNSIGNED INT, // type 
(void* )0 // element array buffer offset 


» 


(小 提示 : 最 好 使 用 unsigned short ， 不 要 用 unsigned int 。 这 样 更 节省 空间 ， 速 度 也 更 快 。 ) 
填充 索引 缓冲 区 


现在 遇 到 真正 的 问题 了 。 如 前 所 述 ， eA 而 OBJ (及 一 些 其 他 常用 的 3D 格 
式 ， 如 Collada) 每 个 属性 都 有 一 个 索引 缓冲 区 。 这 意味 着 ， 必 须 通过 某 种 方式 把 奉 干 个 索引 缓冲 区 合并 成 


o 


合并 算法 如 下 : 


For each input vertex 


Try to find a similar ( = same for all attributes ) vertex between all those we alrea 
If found : 


A similar vertex is already in the VBO, use it instead ! 
If not found : 
No similar vertex found, add it to the VBO 


一 





完整 的 C++ 代码 位 于 common/vboindexer .cpp ， 注 释 很 详尽 。 如 果 理 解 了 以 上 算法 ， 读 懂 代 码 应 该 没 问 
Zi 。 


两 顶点 的 坐标 、UV 坐 标 和 法 线 都 相等 ， 则 认为 两 顶点 是 同一 顶点 。 各 还 有 其 他 属性 ， 这 一 标准 得 酌情 修 


为 了 表述 的 简单 ， 我 们 采用 了 效 脚 的 线性 查找 来 寻找 相似 顶点 。 实 际 中 用 std: :map 会 更 好 。 
补充 : FPS 计 数 器 


虽然 和 索引 没有 直接 关系 ， 但 现在 去 看 看 “FPS 计 数 器 "是 和 
多 少 性 能 。“ 工 具 一 一 调试 器 "中 还 有 些 其 他 和 性 和 in 





这 样 我 们 就 能 看 到 ， 末 引 究 竟 能 提升 





第 十 课 : 透明 
alpha 通 道 


alpha 通 道 的 概念 很 简单 。 之 前 是 写 RGB 结 果 ， 现 在 改 为 写 RGBA : 


out vec4 color; 


E 


前 三 个 分 量 仍 可 以 通过 混合 操作 符 (swizzle operator) .xyz 访 问 ， 最 后 一 个 分 量 通过 .a 访 问 : 


color.a = ; 


AAEM, (Balpha = 不 透明 度 ; 因此 alpha = 1 代表 完全 不 透明 ，alpha = 0 为 完全 透明 。 


这 里 我 们 简单 地 将 alpha 硬 编码 为 0.3 ; 但 更 常见 的 做 法 是 用 一 个 uniform 变 量 表 示 它 ， 或 从 RGBA 纹 理 中 读 
HX (TGA 格 式 支 持 alpha 通 道 ， 而 GLFW 支 持 TGA) 。 


cE ROR, BAR Aaa RHA, ia RAY ESHER ( glDisable(GL CULL FACE) ) . GMMR 
现 模型 没有 了 “ 背 " 面 。 
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顺序 很 重要 1 


上 一 个 截图 看 上 去 还 行 ， 但 这 仅仅 是 运气 好 里 了 。 


问题 所 在 


这 里 我 画 了 一 红 一 绿 两 个 alpha 值 为 50% 的 正方 形 。 从 中 可 以 看 出 顺序 的 重要 性 ， 最 终 的 颜色 显著 影响 了 眼 
青 对 深度 的 感知 。 


Red on top Green on top 


我 们 的 场景 中 也 出 现 了 同样 的 现象 。 试 看 稍稍 改变 一 下 视角 : 
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见解 决 方案 即 对 所 有 的 透明 三 角形 排序 。 是 的 ， 所 有 的 透明 三 角形 。 


e 绘制 场景 的 不 透明 部 分 ， 让 深度 缓冲 区 能 丢 和 天 被 御 挡 的 透明 三 角形 。 

e 对 透明 三 角形 按 深度 从 近 到 远 排 序 。 

e 绘制 透明 三 角形 。 

ALAACiZ SH qsort KARACHI std: :sort KARHE. £e hA ASI. NX 


这 么 做 可 以 解决 问题 (下 一 节 还 会 介绍 它 ) f: 

e 填充 速率 会 被 限制 ， 即 ， 每 个 片断 会 写 10、20 次 ， 也 许 更 多 。 这 对 力不从心 的 内 存 总 线 来 说 太 沉 重 
了 。 通 常 ， 深 度 缓冲 区 可 以 自动 丢弃 “ 远 " 片 断 ; 但 这 时 ， 我 们 显 式 地 对 片断 进行 排序 ， 故 深度 缓冲 区 实 
际 上 没 发 挥 作用 。 

e 这 些 操作 ， 每 个 像素 上 都 会 做 4 通 (我 们 用 了 4 倍 多 重 采 样 抗 锯 齿 (MSAA) ) ， 除 非 用 了 什么 高 明 的 

优化 。 

LA 

e 若 要 逐个 三 角形 地 切换 纹理 ， 或 者 更 糟糕 地 ， 要 切换 着 色 器 一 一 性 能 会 大 打折 扣 。 别 这 么 干 。 


一 个 足够 好 的 解决 方案 是 : 


e 限制 透明 多 边 形 的 数量 

e 对 所 有 透明 多 边 形 使 用 同一 个 着 色 器 和 纹理 

e 各 这 些 透 明 多 边 形 必须 看 起 来 很 不 同 ， 请 用 纹理 区 分 ! 
e 若 不 排序 ， 效 果 也 还 行 ， 那 最 好 别 排序 。 


A Fe Zo 2 x BH 
如 果 你 的 引擎 确实 需要 顶尖 的 透明 效果 ， 这 有 一 些 技术 值得 研究 一 番 : 


e 2001 年 Depth Peeling 论 文 : 像素 级 精细 度 ， 但 速度 不 快 

e BuatDepthPeeting : 小 幅 改进 

e 桶 排序 相关 的 几 篇 论文 。 把 fragment 存 到 数组 ， 在 shader 中 进行 深度 排序 。 

e ATI Mecha Demo : 又 好 又 快 ， 但 实现 起 来 有 难度 ， 需 要 最 新 的 硬件 。 用 链表 存储 fragment。 
e Cyril Crassin 实 现 的 ATI Mecha : 实现 难度 更 大 


注意 ， 即 便 是 《小 小 大 星球 》 (Little Big Planet) 这 种 最 新 的 痛 激 ， 也 只 用 了 一 层 透 明 。 


要 让 之 前 的 代码 运行 ， 得 设置 好 混合 函数 。|n order for the previous code to work, you need to setup your 
blend function. 


// Enable blending 
glEnable(GL BLEND); 
glBlendFunc(GL SRC ALPHA, GL ONE MINUS SRC ALPHA); 


这 意味 看 


New color in framebuffer = 
current alpha in framebuffer * current color in framebuffer + 
(1 - current alpha in framebuffer) * shader's output color 


前 文 所 述 红色 方块 居 上 的 例子 中 : 


new color = 0.5*(0,1,0) + (1-0.5)*(1,0.5,0.5); // (the red was already blended with the w 
new color - (1, 0.75, 0.25) - the same orange 


| 





第 十 一 课 : 2D 文 本 


本 课 将 学 习 如 何在 三 维 场景 之 上 绘制 二 维 文本 。 本 例 是 一 个 简单 的 计时 器 : 
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API 
我 们 将 实现 这 些 简单 的 接口 (LF common/text2D.h ) 


void initText2D(const char * texturepPath ) ; 
void printText2D(const char * text, int x, int y, int size); 
(oid cleanupText2D( ); 


为 了 让 代码 在 640*480 和 1080p 分 辩 率 下 都 能 正常 工作 ，x 和 y 的 范围 分 别 设 为 [0-800] 和 [0-600]。 顶 点 着 色 器 
将 根据 实际 屏幕 大 小 做 对 它 做 调整 。 


完整 的 实现 代码 请 参阅 common/text2D.cpp o 


x TE 


initText2D 简单 地 读 取 一 个 纹理 和 一 些 着 色 器 ， 很 好 理解 。 来 看 看 纹理 : 





[Et Holstein.tga (62%) - Paint.NET v3.5.5 olo] 
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© Paint Bucket: Left click to fill a region with the primary color, right click to fill with the secondary color 1.51024 x 1024 


该 纹理 由 CBFG 生 成 。CBFG 是 诸多 从 字体 生成 纹理 的 工具 之 一 。 把 纹理 加 载 到 Paint.NET， 加 上 红色 背景 
( 仅 为 了 观察 方便 ; 本 教程 中 的 红色 背景 ， 都 代表 透明 ) 。 


printText2D() 在 屏幕 的 适当 位 置 ， 生 成 一 个 纹理 坐标 正确 的 四 边 形 。 
绘制 
首先 ， 填 充 这 些 缓冲 区 : 


std::vector«glm::vec2» vertices; 
std: :vector<glm: :vec2> UVs; 


文本 中 的 每 个 字母 ， 都 要 计算 其 四 按 形 包围 盒 的 顶点 坐标 ， 然 后 添加 两 个 三 角形 〈 组 成 一 个 四 婉 形 ) 


for (Unsigned int erg i- length ire) 


glm::vec2 vertex up left??? = glm::vec2( x+i*size???? , y+size ); 
glm::vec2 vertex up right?? = glm::vec2( x+i*sizet+size, y+size ); 
glm::vec2 vertex down right = glm::vec2( x+i*size+size, y????? ); 
glm::vec2 vertex down left? = glm::vec2( x*i*size???? , y????? ); 


vertices.push back(vertex up left?? ); 
vertices.push-back(vertex down left ); 
vertices.push back(vertex up right? ); 


vertices.push back(vertex down right); 
vertices.push back(vertex up right); 
vertices.push back(vertex down left); 


轮 到 UV 坐标 了 。 计 算 左 上 角 的 坐标 : 


char character = text[i]; 
float uv x = (character%16)/16.0f; 
float uv y = (character/16)/16.0f; 


这 样 做 是 可 行 的 (基本 可 行 ， 详 见 下 文 ) ， 因 为 A 的 ASCII 值 为 65。 659616 = 1， 因 此 A 位 于 第 1 列 〈 列 号 从 


0 开始 ) 。 


65/16 = 4， 因 此 人 A 位 于 第 4 行 (这 是 整数 除法 ， 所 以 结果 不 是 想象 中 的 4.0625) 


两 者 都 除 以 16.0 以 使 之 落 于 [0.0 - 1.0] 区 间 内 ， 这 正 是 OpenGL 纹 理 所 需 的 。 


现在 只 需 对 项 点 重复 相同 的 操作 : 


glm::vec2 uv up left 
glm::vec2 uv up right 
glm::vec2 uv down right 
glm::vec2 uv down left 


glm::vec2( uv x , LOF- uv y); 
glm: :vec2( uv_x+1.0f/16.0f, 1.0f - uv- y ); 
glm: :vec2( uv_x+1.0f/16.0f, 1.0f - (uv_y + 1.0f/16.0f) 
glm::vec2( uv x , 1.0f - (uv_y + 1.0f/16.0f) 


UVs.push_back(uv_up_left ye 
UVs.push_back(uv_down_left ); 
UVs.push back(uv up right ); 


UVs.push back(uv. down right); 
UVs.push. back(uv. up right); 
UVs.push back(uv down left); 





ERRE i 绑 定 缓冲 区 ， 填 充 ， 选 择 着 色 器 程序 ， 绑 定 纹 理 ， 开 启 、 绑 定 、 配 置顶 点 属性 ， 
开启 混合 ， 调 用 glDrawArrays。 欧 也 ， -— 


注意 非常 重要 的 一 点 : xe F(0,800][0, 600 3b EP, Hiei, 3 BASES. vertex shader R 
高 简 a et (也 可 以 在 C++ 代 码 中 完成 这 一 步 ) 。 


void main(){ 


j 


- —— 


// Output position of the vertex, in clip space 

// map [0..800][0..600] to [-1..1][-1..1] 

vec2 vertexPosition homoneneousspace - vertexPosition screenspace - vec2(400,300) 
vertexPosition homoneneousspace /- vec2(400,300); 

gl Position = vec4(vertexPosition homoneneousspace,0,1); 


// UV of the vertex. No special space for this one. 
UV = vertexUV; 





fragment shader 的 工作 也 很 少 : 


void main(){ 


color = texture( myTextureSampler, UV ); 


顺便 说 一 下 ， 别 在 工程 中 使 用 这 些 代 码 ， 因 为 它 只 能 人 处理 拉丁 字符 。 否 则 你 的 产品 在 印度 、 中 国 、 日 本 
(甚至 德国 ， 因 为 纹理 上 没有 BR 这 个 字母 ) 就 别 想 卖 了 。 这 幅 纹 理 是 我 用 法 语 字 符 集 生成 的 ， 在 法 国 用 用 还 
可 以 《注意 6, à, 6 等 字母 )。 修 改 其 他 教程 的 代码 时 注意 库 的 使 用 。 其 他 教程 大 多 使 用 OpenGL 2， 和 本 教 
程 不 兼容 。 很 可 惜 ， 我 还 没 找到 一 个 足够 好 的 、 能 处 理 UTF-8 字 符 集 的 库 。 


顺带 提 一 下 ， 您 最 好 看 看 Joel Spolsky 写 的 The Absolute Minimum Every Software Developer Absolutely, 
Positively Must Know About Unicode and Character Sets (No Excuses!), 


如 果 您 需要 义理 大 量 的 文本 ， 可 以 参考 这 篇 Valve 的 文章 。 


第 十 二 课 : OpenGL; R 


扩展 


GPU 的 性 能 随 着 更 新 换代 一 直 在 提高 ， 支 持 演 染 更 多 的 三 角形 和 像素 点 。 然 而 ， 原 始 性 能 不 是 我 们 唯一 关 
心 的 。NVIDIA, AMD 和 Intel 也 通过 增加 功能 来 改善 他 们 的 显卡 。 来 看 一 些 例子 。 


ARB fragment program 


回溯 到 2002 年 ，GPU 都 没有 顶点 着 色 器 或 片断 着 色 器 : 所 有 的 一 切 都 硬 编 码 在 心 片 中 。 这 被 称 为 固定 功能 
流水 线 (Fixed-Function Pipeline (FFP)) 。 同 样 地 ， 当 时 最 新 的 OpenGL 1.3 中 也 没有 接口 可 以 创建 、 操 作 
和 使 用 所 谓 的 “着 色 器 ”"， 因 为 它 根 本 不 存在 。 接 着 NVIDIA 决 定 用 实际 代码 描述 泻 染 过 程 ， 来 取代 数 以 百 计 
的 标记 和 状态 量 。 这 就 是 ARB fragment_program 的 由 来 。 当 时 还 没有 GLSL， 但 你 可 以 写 这 样 的 程序 : 


!'ARBfp1.0 MOV result.color, fragment.color; END 


(ASE y sb OpenGLÍ[e Fix ess, f fum E—HEei:rtÍEOpenGLBEBJREXRPQZN. TESETIÉARREBU, BAT 
例子 。 


ARB_debug_ output 


好 ， 你 说 lARB _ fragment_program 太 老 了 ， 所 以 我 不 需要 扩展 这 东西 」? 其 实 有 不 少 新 的 扩展 非常 方 
便 。 其 中 一 个 便 是 ARB_debug_output， 它 提供 了 一 个 不 存在 于 OpenGL 3.3 中 的 ， 但 你 可 以 /应 该 用 到 的 功 
能 。 它 定义 了 像 GL DEBUG OUTPUT SYNCHRONOUS ARB 或 

GL DEBUG SEVERITY MEDIUM ARB;Z ž JFE, #1DebugMessageCallbackARBi& ## EEX, 3x 
个 扩展 的 伟大 之 处 在 于 ， 当 你 写 了 一 些 不 正确 的 代码 ， 例 如 : 


“a 


glEnable(GL_TEXTURE); // Incorrect ! You probably meant GL_TEXTURE_2D ! 


IRB EIFE | 错 误 消 息 和 错误 的 精确 位 置 。 总 结 


e 即便 在 现在 的 OpenGL 3.3 中 ， 扩 展 仍旧 十 分 有 用 。 
e 请 使 用 ARB debug output ! 下 文 有 链接 。 





orials (Déboaaae! - Microsoft Vis qme Fem x ] 
Fichier Edition Affichage Projet Générer Déboguer Equipe Nsight Données Outils Architecture Test Analyser Fenêtre 2 | 
Par 2 ud iA-a33i|9-Cc-£- | debug Win32 119 | swap_e “|| A Gh Bde 2E LAE 





E B Ta Pile des appels 


Nom | Lang ^ 
+O tutoriall2 extensions. — C++ 


| atio gh dil!691f651 9 


if(source -- GL DEBUG SOURCE API ARB) printf("Source : "3 
else if(source GL DEBUG SOURCE WINDOW SYSTEM ARB) printf("Source : MINDOM. SYSTEM; "M 
else if(source == GL DEBUG SOURCE SHADER COMPILER ARB) printf("Source : SHADER COMPILER; " 
else if(source GL DEBUG SOURCE THIRD PARTY ARB) printf("Source : THIRD PARTY; "); | atiogho.di 
else if(source -- GL DEBUG SOURCE APPLICATION ARB) printf("Source : APPLICATION; "); [gj |5t09ho-diie916eclO 
else if(source -- GL DEBUG SOURCE OTHER ARB) printf("Source : OTHER; "); L | atioghax.dIl'691F7211 () 

atiogboc.dll469646f43 
if(type -- GL DEBUG TYPE ERROR ARB) printf("Type : ERROR; "); tutoriall2 extensions.e € pia 
else if(type -- GL DEBUG TYPE DEPRECATED BEHAVIOR ARB) printf("Type : DEPRECATED BEHAVIOR; " tutoriall2 extensions.e ++ 
else if(type == GL DEBUG TYPE UNDEFINED BEHAVIOR ARB)  printf("Type : UNDEFINED BEHAVIOR; " | tutoriall2 extensions.e 
else if(type == GL DEBUG TYPE PORTABILITY ARB) printf("Type : PORTABILITY; "); —— extensions. exelmainCRTStartup| C 
else if(type == GL DEBUG TYPE PERFORMANCE ARB) printf("Type : PERFORMANCE; "); kernel32.dll76£e339a ) 
else if(type == GL DEBUG TYPE OTHER ARB) printf("Type : OTHER; "); Mc 7b79ef2 


ntdll.dil77b79ec5 


[Les fram res ci-dessous is sont peut étre ned 
一 一 一 -一 


691f5dec ， 











if(severity == GL DEBUG SEVERITY HIGH ARB) printf("Severity : HIGH; "); 
else if(severity == GL DEBUG SEVERITY MEDIUM ARB) printf("Severity : MEDIUM; "); 
else if(severity -- GL DEBUG SEVERITY LOW ARB) printf("Severity : LOW; "); 


// You can set a breakpoint here ! Your debugger will stop the program, 
// and the callstack will immediately show you the offending call. 
printf("Message : %s\n", message); 











Automatique 


* $9 message 0061 2620 "glCompileShader failed to compile a GLSL shader with the following shader info log: Fragment shader failed to compile with the following e à ~| cBnst ch 
: signet 
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获取 扩展 -复杂 的 方式 


『 手 动 」 查找 一 个 扩展 的 方法 是 使 用 以 下 代码 片断 (转自 OpenGL.org wiki) : 


int NumberOfExtensions; 
glGetIntegerv(GL_NUM_EXTENSIONS, &NumberOfExtensions); 
for(i-0; i«NumberOfExtensions; i++) ( 
const GLubyte *ccc-glGetStringi(GL EXTENSIONS, i); 
if ( strcmp(ccc, (const GLubyte *)'"GL ARB debug output") == 0 ){ 
// The extension is supported by our hardware and driver 
// Try to get the "glDebugMessageCallbackARB" function 
glDebugMessageCallbackARB = (PFNGLDEBUGMESSAGECALLBACKARBPROC) wglGetProcAddress("gl 





得 所 有 的 扩展 - 简单 的 方式 


上 面 的 方式 太 复 杂 。 耕 用 GLEW, GLee, gl3w 这 些 库 ， 就 简单 多 了 。 例 如 ， 有 了 GLEW， 你 只 需要 在 创建 禄 
口 后 调用 glewlnit()， 不 少 方便 的 变量 就 创建 好 了 : 


if (GLEW_ARB_debug_output){ // Ta-Dah ! } 


(小 心 : debug_output 是 特殊 的 ， 因 为 你 需要 在 上 下 文 创建 的 时 候 馈 用 它 。 在 GLFW 中 ， 这 通过 
glfwOpenWindowHint(GLFW_OPENGL_DEBUG_CONTEXT, 1) 完成 。) 


ARB vs EXT vs ... 


扩展 的 名 字 上 暗示 了 它 的 适用 沁 围 : 


GL: 所 有 平台 ; GLX: 只 有 Linux 和 Mac 下 可 使 用 (X11) ; WGL :只 有 Windows 下 可 使 用 。 


EXT: 通 用 的 扩展 。 ARB: 已 经 被 OpenGL 架 构 评 审 委员 会 的 所 有 成 员 接 受 (EXT RRZARME Steet 
为 ARB) 的 扩展 。 NV/AMD/INTEL: 顾 名 思 义 =) 


设计 与 扩展 
问题 


比方 说 ， 你 的 OpenGL 3.3 应 用 程序 需要 泻 染 一 些 大 型 线条 。 你 能 够 写 一 个 复杂 的 顶点 着 色 器 来 完成 ， 或 者 
简单 地 用 GL NV. path. _rendering， 它 能 帮 你 处 理 所 有 复杂 的 事 。 


因此 你 可 以 这 样 写 代 码 : 


if ( GLEW_NV_path_rendering ){ 
glPathStringNV( ... ); // Draw the shape. Easy ! 
telse{ 
// Else what ? You still have to draw the lines 
// on Older NVIDIA hardware, on AMD and on INTEL ! 
// So you have to implement it yourself anyway ! 


均衡 考量 


当 使 用 扩展 的 益处 GSAS. MRE) ， 超 过 维 折 两 种 不 同方 法 (如 上 面 的 代码 ， 一 种 靠 你 自己 实现 ， 
一 种 使 用 扩展 ) 的 代价 时 ， 通 党 就 选择 用 扩展 。 


例如 ， 在 时 空 幻境 (Braid, 一 个 时 空 穿越 的 二 维 游戏 ) 中 ， 当 你 干扰 时 间 时 ， 融 会 有 各 种 各 样 的 图 像 变 形 
效果 ， 而 这 种 效果 在 旧 硬 件 上 没 ; eR. 


而 在 OpenGL 3.3 及 更 高 版 本 中 ， 包 含 了 99% 的 你 可 能 会 用 到 的 工具 。 一 些 扩 展 很 有 用 ， 比 如 
GL AMD pinned memory, & AGCA $525 3A LAE BUTS FHGL. ARB. framebuffer_object( 用 于 纹理 泻 染 ) 那 样 
让 你 的 游戏 看 起 来 变 好 10 倍 。 


如 果 你 不 得 不 兼容 老 硬 件 ， 那 么 就 不 能 用 OpenGL 3+， 你 需要 用 OpenGL 2+ 来 代替 。 你 将 不 再 能 使 用 各 种 
伸 奇 的 扩展 了 ， 你 需 自 行 义理 那些 问题 。 


更 多 的 细节 可 以 参考 例子 DpenGL 2.1 版 本 的 第 14 课 一 纹理 泻 染 ， 第 152 行 ， 需 手动 检查 
GL ARB framebuffer object 是 否 存 在 。 常 见 问题 可 见 FAQ。 


结论 Conclusion 
OpenGL 扩 展 提 供 了 一 个 很 好 的 方式 来 增强 OpenGL 的 功能 ， 它 依赖 于 你 用 户 的 GPU。 


虽然 现在 扩展 属于 高 级 用 法 (因为 大 部 分 功能 在 核心 中 已 经 有 了 ) ， 了 解 扩 展 如 何 运 作 和 怎么 用 它 提高 
件 性 能 (付出 更 高 的 维 扩 代 价 ) 还 是 很 重要 的 。 


S 


采 度 阅读 


。 debug_output tutorial by Aks 因为 有 GLEW， 你 可 以 跳 过 第 一 步 。 
e The OpenGL extension registry 所 有 扩展 的 规格 说 明 。 圣 经 。 


e GLEW OpenGL is Ey BE 
e gl3w 简单 的 OpenGL 3/4 核 心 配置 加 载 


第 十 三 课 : 法 线 贴图 
欢迎 来 到 第 十 三 课 ! 今天 讲法 线 贴 图 (normal mapping) 。 


学 完 第 八 课 : 基本 光照 模型 后 ， 我 们 知道 了 如 何 用 三 角形 法 线 得 到 不 错 的 光照 效果 。 需 要 注意 的 是 ， 截 至 
相反 。 
法 线 纹理 


法 线 纹理 看 起 来 像 这 样 : 


j "E 


E. = at 
ru Tue rur. Papae ri P. 
I la -- d H z ni "^ 


BAN ere 





每 个 纹 素 的 RGB 值 实际 上 表示 的 是 XYZ 向 量 : 颜色 的 分 量 取 值 范围 为 0 到 1， 而 向 量 的 分 量 取 值 范围 是 -1 到 
1; 可 以 建立 从 纹 素 到 法 线 的 简单 映射 : 


normal = (2*color)-1 // on each component 
法 线 纹理 整体 呈 蓝 色 ， 因 为 法 线 基本 是 朝 上 的 〈 上 方 即 Z 轴 正 向 。OpenGL 中 Y 轴 = 上 ， 有 所 不 同 。 这 种 不 兼 
容 很 泰 ， 但 没 人 想 为 此 重 写 现 有 的 工具 ， 我 们 将 融 用 吧 。 后面 介绍 详情 。 
法 线 纹理 的 映射 方式 和 颜色 纹理 相似 。 麻 烦 的 是 如 何 将 法 线 从 各 三 角形 局 部 坐标 系 〈 切 线 坐标 系 tangent 
space， 亦 称 图 像 坐 标 系 image space) 变换 到 模型 坐标 系 (计算 光照 采用 的 坐标 系 ) 。 
切线 和 双 切 线 (Tangent and Bitangent) 


ABD AO FB EO TOPE ST ; 大 家 知道 ， 定 义 一 个 坐标 系 《本 例 是 切线 坐标 系 ) 需要 三 个 向 量 。 现 在 
Up 向量 已 经 有 了 ， 即 法 线 : 可 用 Blender 计 算 ， 或 做 一 个 简单 的 又 乘 。 下 图 中 蓝 色 箭头 代表 法 线 (法 线 贴 图 
整体 颜色 也 恰好 是 蓝 色 ) 。 





然后 是 切线 T : 垂直 于 平面 的 向 量 。 切 线 有 很 多 个 : 





这 人 么 多 切线 中 该 选 哪 一 个 呢 ? 理论 上 ， 任 何 一 个 都 可 以 。 不 过 我 们 得 和 相 邻 顶点 保持 一 致 ， 以 免 导致 边缘 
出 现 瑕 疲 。 一 个 通行 的 办 法 是 将 切线 方向 和 纹理 坐标 系 对 齐 : 





定义 一 组 基 需 要 三 个 向 量 ， 因 此 我 们 还 得 计算 双 切 线 B 〈 本 来 可 以 随便 选 一 条 切线 ， 但 选 定 垂 直 于 其 他 两 条 
轴 的 切线 ， 计 算 会 方便 些 ) 。 





算法 如 下 : 在 把 三 角形 的 两 条 边 记 为 deltaPosi 和 deltaPos2, deltauvi 和 deltauv2 是 对 应 的 UV 坐 
标 下 的 差 值 ; 此 问题 可 用 如 下 方程 表示 : 


deltaPosi 
deltaPos2 


deltaUV1.x * T + deltaUVi.y * B 
deltaUV2.x * T + deltaUV2.y * B 


求解 T 和 B 融 得 到 了 切线 和 双 切 线 | (代码 见 下 文 ) 


已 知 T、B、N 癌 量 之 后 ， 即 可 得 下 面 这 个 漂 腕 的 矩阵 ， 完 成 从 模型 坐标 系 到 切线 坐标 系 的 变换 : 


^ TTBNOBEE, RMAIL 〈 从 法 线 纹 理 中 提取 而 来 ) 变换 到 模型 坐标 系 。 


可 我 们 需要 的 却 是 与 之 相反 的 变换 : 从 切线 坐标 系 到 模型 坐标 系 ， 法 线 保持 不 变 。 所 有 计算 均 在 切线 坐标 
系 中 进行 ， 不 会 对 其 他 计算 产生 影响 。 


既然 要 进行 遂 同 的 变换 ， 那 只 需 对 以 上 矩阵 求 逆 即 可 。 这 个 和 矩阵 ( 正 交 阵 ， 即 各 同 量 相 互 正 交 ， 请 看 后 
面 "延伸 阅读 "小 节 ) WAR EA EER HBS, SETA eS: 


invTBN = transpose(TBN) 


DF BU 

LOB, NN] [E T, T. 
dix B, Ny = |B; B, P, 
S NN 
准 各 VBO 

计算 切线 和 双 切 线 


我 们 需要 为 整个 模型 计算 切线 、 双 切线 和 法 线 。 用 一 个 单独 的 函数 完成 这 项 工作 : 


void computeTangentBasis( 


)i 


// inputs 

std::vector<glm: :vec3 
std: :vector<glm: :vec2 
std: :vector<glm: :vec3 
// outputs 

std: :vector<glm: :vec3 
std: :vector<glm: :vec3 


> & vertices, 
> & UVS, 
> & normals, 


> & tangents, 
> & bitangents 


为 每 个 三 角形 计算 边 (deltaPos ) 和 deltauv 


for ( int 1=0; i<vert 


// Shortcuts for 
glm::vec3 & vO = 
glm::vec3 & vi = 
glm::vec3 & v2 = 


// Shortcuts for 

glm::vec2 & uvO = 
glm::vec2 & uvi = 
glm::vec2 & uv2 = 


// Edges of the t 
glm::vec3 deltaPo 
glm: :vec3 deltaPo 


// UV delta 


ices.size(); 1+=3){ 


vertices 

vertices[i-0]; 
vertices[i-1]; 
vertices[1i+2]; 


UVS 
uvs[i+0]; 
Uvs[1i+1]; 
uvs[i+2]; 


riangle : postion delta 
S1 = vi-v0; 
S2 = v2-v0; 


glm::vec2 deltaUV1 = uvi-uv0; 
glm::vec2 deltaUV2 = uv2-uv0; 


现在 用 公式 来 算 切 线 和 双 切 线 : 


float r = 1.0f / 
glm::vec3 tangent 
glm::vec3 bitange 


(deltaUV1.x * deltaUV2.y - deltaUV1.y * deltaUV2.x); 
= (deltaPosi * deltaUV2.y - deltaPos2 * deltaUV1.y)*r; 
nt = (deltaPos2 * deltaUV1.x - deltaPosi * deltaUV2.x)*r; 


最 后 ， 把 这 些 切线 和 双 切 线 缓存 到 数组 。 记 住 ， 还 没 为 这 些 缓存 的 数据 生成 素 引 ， 因 此 每 个 顶点 都 有 一 份 


// Set the same t 
// They will be m 
tangents.push_bac 
tangents.push_bac 
tangents.push_bac 


// Same thing for 
bitangents.push_b 
bitangents.push_b 
bitangents.push_b 


angent for all three vertices of the triangle. 
erged later, in vboindexer.cpp 

k( tangent ); 

k( tangent ); 

k( tangent ); 


binormals 
ack(bitangent); 
ack(bitangent); 
ack(bitangent); 


生成 索引 
索引 VBO 的 方法 和 之 前 类 似 ， 仅 有 些许 不 同 。 


各 找到 一 个 相似 顶点 〈 相 同 的 坐标 、 法 线 、 纹 理 坐 标 ) ， 我 们 不 使 用 它 的 切线 、 次 法 线 ; 反而 要 取 其 均 
值 。 因 此 ， 只 需 把 旧 代码 修改 一 下 : 


// Try to find a similar vertex in out XXXX 
unsigned int index; 
bool found = getSimilarVertexIndex(in_vertices[i], in uvs[i], in normals[i], 


if ( found )( // A similar vertex is already in the VBO, use it instead ! 
out indices.push back( index ); 


// Average the tangents and the bitangents 
out tangents[index] += in tangents[i]; 
out bitangents[index] += in bitangents[i]; 
telse{ // If not, it needs to be added in the output data. 
// Do as usual 


[sss] 





注意 ， 这 里 没 做 规范 化 。 这 样 做 很 讨 巧 ， 因 为 小 三 角形 的 切线 、 双 切线 同 量 也 小 ; 相对 于 大 三 角形 (对 最 
终 形状 影响 较 大 ) ， 对 最 终结 果 的 影响 力也 融 小 。 


Shader 





新 增 的 缓冲 区 和 uniform 变量 
新 加 上 两 个 缓冲 区 : 分 别 存放 切线 和 双 切 线 : 


GLuint tangentbuffer; 

glGenBuffers(1, &tangentbuffer); 

glBindBuffer(GL ARRAY BUFFER, tangentbuffer); 

glBufferData(GL ARRAY BUFFER, indexed tangents.size() * sizeof(glm::vec3), &indexed t 


GLuint bitangentbuffer; 

glGenBuffers(1, &bitangentbuffer); 

glBindBuffer(GL ARRAY BUFFER, bitangentbuffer); 

glBufferData(GL ARRAY BUFFER, indexed bitangents.size() * sizeof(glm::vec3), &indexed 


a 一 -一 





还 需要 一 个 uniform 变 量 存储 新 的 法 线 纹理 : 


[E] 

GLuint NormalTexture = loadTGA glfw("normal.tga"); 

[x] 

GLuint NormalTextureID = glGetUniformLocation(programID, "NormalTextureSampler"); 


另外 一 个 uniform 变 量 存 储 3x3 的 模型 视图 和 矩阵。 严格 地 讲 ， 这 个 矩阵 不 必要 ， 但 有 它 更 方便 ; i# LAX. 
由 于 信 仅 计算 旋转 ， 不 需要 位 移 ， 因 此 只 需 和 矩阵 左上 角 3x3 的 部 分 。 


GLuint ModelView3x3MatrixID = glGetUniformLocation(programID, "MV3x3"); 


完整 的 绘制 代码 如 下 : 


// Clear the screen 
glClear(GL COLOR BUFFER BIT | GL DEPTH BUFFER BIT); 


// Use our shader 
glUseProgram(programID); 


// Compute the MVP matrix from keyboard and mouse input 
computeMatricesFromInputs(); 

glm::mat4 ProjectionMatrix = getProjectionMatrix(); 

glm::mat4 ViewMatrix - getViewMatrix(); 

glm::mat4 ModelMatrix - glm::mat4(1.0); 

glm::mat4 ModelViewMatrix - ViewMatrix * ModelMatrix; 

glm::mat3 ModelView3x3Matrix = glm::mat3(ModelViewMatrix); // Take the upper-left 
glm::mat4 MVP - ProjectionMatrix * ViewMatrix * ModelMatrix; 


// Send our transformation to the currently bound shader, 

// in the "MVP" uniform 

glUniformMatrix4fv(MatrixID, 1, GL FALSE, &MVP[0][0]); 
glUniformMatrix4fv(ModelMatrixID, 1, GL FALSE, &ModelMatrix[0][9]); 
glUniformMatrix4fv(ViewMatrixID, 1, GL FALSE, &ViewMatrix[0][0]); 
glUniformMatrix4fv(ViewMatrixID, 1, GL FALSE, &ViewMatrix[0][9]); 
glUniformMatrix3fv(ModelView3x3MatrixID, 1, GL FALSE, &ModelView3x3Matrix[0][0]); 


glm::vec3 lightPos = glm::vec3(0,0,4); 
glUniform3f(LightID, lightPos.x, lightPos.y, lightPos.z); 


// Bind our diffuse texture in Texture Unit 0 

glActiveTexture(GL TEXTUREO); 

glBindTexture(GL TEXTURE 2D, DiffuseTexture); 

// Set our "DiffuseTextureSampler" sampler to user Texture Unit 0 
glUniformii(DiffuseTextureID, 0); 


// Bind our normal texture in Texture Unit 1 

glActiveTexture(GL TEXTURE1); 

glBindTexture(GL TEXTURE 2D, NormalTexture); 

// Set our "Normal TextureSampler" sampler to user Texture Unit O 
glUniformii(NormalTextureID, 1); 


// irst attribute buffer : vertices 
glEnableVertexAttribArray(0); 
glBindBuffer(GL ARRAY BUFFER, vertexbuffer); 
glVertexAttribPointer( 


0, // attribute 

3; // size 

GL_FLOAT, // type 

GL_FALSE, // normalized? 

0, // stride 

(void*)O // array buffer offset 


m 


// 2nd attribute buffer : UVs 
glEnableVertexAttribArray(1); 
glBindBuffer(GL ARRAY BUFFER, uvbuffer); 
glVertexAttribPointer( 
d // attribute 
2 // size 


ee 


GL_FLOAT, // type 


GL_FALSE, // normalized? 
0, // stride 
(void*)O // array buffer offset 


Le 


// 3rd attribute buffer : normals 
glEnableVertexAttribArray(2); 
glBindBuffer(GL ARRAY BUFFER, normalbuffer); 
glVertexAttribPointer( 


2 // attribute 

3; // size 

GL FLOAT, // type 

GL FALSE, // normalized? 

0, // stride 

(voud= 09 // array buffer offset 


» 


// 4th attribute buffer : tangents 
glEnableVertexAttribArray(3); 
glBindBuffer(GL ARRAY BUFFER, tangentbuffer); 
glVertexAttribPointer( 


S // attribute 

3; // size 

GL FLOAT, // type 

GL FALSE, // normalized? 

0, // stride 

(void*)O // array buffer offset 


) 


// 5th attribute buffer : bitangents 
glEnableVertexAttribArray(4); 
glBindBuffer(GL ARRAY BUFFER, bitangentbuffer); 
glVertexAttribPointer( 


av // attribute 

3; // size 

GL_FLOAT, // type 

GL_FALSE, // normalized? 

0, // stride 

(void*)O // array buffer offset 


Ve 


// Index buffer 
glBindBuffer(GL ELEMENT ARRAY BUFFER, elementbuffer); 


// Draw the triangles ! 


glDrawElements( 
GL TRIANGLES, // mode 
indices.size(), // count 
GL UNSIGNED INT, // type 
(void*)O // element array buffer offset 


)5 


glDisableVertexAttribArray(9); 
glDisableVertexAttribArray(1); 
glDisableVertexAttribArray(2); 
glDisableVertexAttribArray(3); 
glDisableVertexAttribArray(4); 


// Swap buffers 
glfwSwapBuffers(); 





Vertex shader 


和 前 面 讲 的 一 样 ， 所 有 计算 都 在 观察 坐标 系 中 做 ， 因 为 在 这 获取 片断 坐标 更 容易 。 这 就 是 为 什么 要 用 模型 
视图 矩阵 乘 T、B、N 向 量 。 


vertexNormal cameraspace = MV3x3 * normalize(vertexNormal modelspace); 
vertexTangent cameraspace - MV3x3 * normalize(vertexTangent modelspace); 
vertexBitangent cameraspace - MV3x3 * normalize(vertexBitangent modelspace); 


这 三 个 向 量 确 定 了 TBN 和 矩阵 ， 其 创建 方式 如 下 : 


mat3 TBN = transpose(mat3( 
vertexTangent_cameraspace, 
vertexBitangent_cameraspace, 
vertexNormal_cameraspace 
)); 77 You can use dot products instead of building this matrix and transposing it. S 


a EN 


此 和 矩阵 是 从 观察 坐标 系 到 切线 坐标 系 的 变换 ( 若 有 一 矩阵 名 为 XXX modelspace ， 则 它 执行 的 是 从 模型 坐 
标 系 到 切线 坐标 系 的 变换 ) 。 可 以 利用 它 计 算 切 线 坐 标 系 中 的 光线 方向 和 视线 方向 。 





LightDirection_tangentspace = TBN * LightDirection_cameraspace; 
EyeDirection tangentspace = TBN * EyeDirection_cameraspace; 


Fragment shader 


切线 坐标 系 中 的 法 线 很 容易 获取 : EEE : 


// Local normal, in tangent space 
vec3 TextureNormal_tangentspace = normalize(texture2D( NormalTextureSampler, UV ).rgb 


B — ——S TU À e! 


—UE 45H. ESI BJIEUAZXAg: xmi; BTA RRP RSHABE, mun 
和 | 必须 位 于 同一 坐标 系 中 ) ， 再 用 clamp( dot( n,/ ), 0,1 exe. &rmi»5HFiclamp( dot( E,R ), 0,1 B&E, EFN 
R 也 必须 位 于 同一 坐标 系 中 。 搞 定 1 S 





这 是 目前 得 到 的 结果 ， 可 以 看 到 : 


e 砖 块 看 上 去 四 凸 不 平 ， 这 是 因为 砖 块 表 面 法 线 变化 比较 剧烈 
。 水 泥 部 分 看 上 去 很 平整 ， 这 是 因为 这 部 分 的 法 线 纹理 都 是 整齐 的 蓝 色 
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延伸 阅读 


正 交 化 (Orthogonalization ) 


Vertex shader 中 ， 为 了 计算 得 更 快 ， 我 们 没有 用 算 阵 求 闭 ， 而 是 进行 了 转 置 。 这 只 有 当 和 矩阵 表示 的 坐标 系 
是 正 交 的 时 候 示 成 立 ， 而 眼前 这 个 和 矩 阵 还 不 是 正 交 的 。 笠 运 的 是 MEE : 只 需 
在 computeTangentBasis() 末尾 让 切线 与 法 线 垂直 。| 


= glm::normalize(t - n * glm::dot(n, t)); 


这 个 公式 有 点 难 理解 ， 来 看 看 图 : 


n 






-n*dot(n,t) 


dot(n.t) 


n 和 t 差 不 多 是 相互 垂直 的 ， 只 要 把 t 治 -n 方向 稍微 *“ 压 "一 下 ， 这 个 幅度 是 dot(n,t) 。 这 里 有 一 个 applet 
也 讲 得 很 清楚 ( 仅 含 两 个 向 量 ) 


左手 坐标 系 还 是 右手 坐标 系 ? 

一 般 不 必 担 心 这 个 问题 。 但 在 某 些 情况 下 ， 比 如 使 用 对 称 模 型 时 ，UV 坐 标 方向 是 错 的 ， 导 致 切线 T 方 向 错 
Iko 

检查 是 否 需 要 翻转 这 些 方 向 很 容易 : TBN 必 须 形 成 一 个 右手 坐标 系 ， 即 ， 向 量 cross(n,t) 应 该 和 b 同 向 。 


用 数学 术语 讲 ，“ 向 量 和 A 和 向 量 B 同 向 ”就 是 "dot (A,B)>0 ”; 故 只 需 检 查 dot( cross(n,t) , b ) 是 否 大 于 
Ou 


i dot( cross(n,t) , b ) <0, MMe t 


if (glm::dot(gim::cross(m t); bD) < TEM 
t =t * -1.0f; 
j 


在 computeTangentBasis() 末 对 每 个 顶点 都 做 这 个 操作 。 


高 光 纹 理 (Specular texture) 


纯粹 出 于 乐趣 ， 我 在 代码 里 加 上 了 高 光 纹 理 ; 取代 了 原先 作为 高 光 颜 色 的 灰色 veca(0.3,0.3,0.3) ， 现 在 
看 起 来 像 这 样 : 
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注意 ， 现 在 水 泥 部 分 始终 是 黑色 的 : 因为 高 光 纹 理 中 ， 其 高 光 分 量 为 0。 


用 立即 模式 进行 调试 
本 下 的 初衷 是 让 大 家 不 再 使 用 过 时 、 缓慢、 问题 频 出 的 立即 模 陈 。 


不 过 ， 用 立即 模式 进行 调试 却 十 分 方便 : 
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这 里 ， 我 们 在 立即 模式 下 图 了 一 些 线 条 表示 切线 坐标 系 。 


要 进入 立即 模式 ， 得 关闭 3.3 Core Profile : 


glfwOpenWindowHint (GLFW_OPENGL_PROFILE, GLFW OPENGL COMPAT PROFILE); 


然后 把 矩阵 传 给 旧式 的 OpenGL 流 水 线 (你 也 可 以 另 写 一 个 着 色 器 ， 不 过 这 样 做 更 简单 ， 反 正 都 是 在 
hacking) 


glMatrixMode(GL_PROJECTION) ; 

glLoadMatrixf((const GLfloat*)&ProjectionMatrix[0]); 
glMatrixMode(GL_MODELVIEW) ; 

glm::mat4 MV = ViewMatrix * ModelMatrix; 
glLoadMatrixf((const GLfloat*)&MV[0]); 


ARE s: 


glUseProgram(0); 


然后 画 线 条 (APPEAR ORM S165, SET0.1, MET xb S WAL) 


glColor3f(0,0,1); 
glBegin(GL LINES); 
for (int i20; i«indices.size(); i++){ 


glm::vec3 p = indexed vertices[indices[ill; 
glVertex3fv(&p.x); 

glm::vec3 o = glm::normalize(indexed normals[indices[il]l); 
p+=0* ; 

glVertex3fv(&p.x); 


} 
glEnd(); 


记 住 : 实际 项 目 中 不 要 用 立即 模式 ! 只 在 调试 时 用 1 别 扎 了 之 后 恢复 到 Core Profile， 它 可 以 保证 不 会 启用 
立即 模式 | 


用 颜色 进行 调试 


调试 时 ， 将 向 量 的 值 可 视 化 很 有 用 。 最 简单 的 方法 是 把 向 量 都 写 到 帧 缓冲 区 。 举 个 例子 ， 我 们 
把 LightDirection_tangentspace 可 视 化 一 下 试 试 


color.xyz = LightDirection_tangentspace; 











ix jt BH : 


e 在 圆柱 体 的 右 侧 ， 光 线 〈 如 白色 线条 所 示 ) SHE 《在 切线 坐标 系 中 ) 的 。 也 融 是 说 ， 光 线 和 三 角形 
的 法 线 同 同 。 


e 在 圆柱 体 的 中 间 部 分 ， 光 线 和 切线 方向 〈 指 向 +X) flm. 


e 可 视 化 前 ， 变 量 是 否 需要 规范 化 ?2 这 取决 于 具体 情况 。 

o RATES. 就 逐 分 量 地 可 视 化 。 比 如 ， 只 观察 红色 ， 而 将 绿色 和 蓝 色 分 量 强制 设 为 0。 

e 别 折腾 alpha 值 ， 太 复 订 了 站 > 

e 和 石 想 将 一 个 负 值 可 视 化 ， 可 以 采用 和 义理 法 线 纹理 一 样 的 技巧 : 转 而 把 (v«1.0)/2.0 可 视 化 ， 于 是 黑 
色 就 代表 -1， 而 白色 代表 +1。 只 不 过 这 样 做 有 点 绕 鹤 子 。 


用 变量 名 进行 调试 


前 面 已 经 讲 过 了 ， 搞 清楚 向 量 所 处 的 坐标 系 至 关 重 要 。 干 万 别 把 一 个 观察 坐标 条 里 的 向 量 和 一 个 模型 坐标 
系 里 的 向 量 做 点 乘 。 


给 向 量 名 称 添加 后 级 "modelspace” 可 以 有 效 地 避免 这 类 计算 错误 。 


怎样 制作 法 线 贴图 


‘ES James O'Hare. 点击 图 片 放 大 。 


The Dilluse BE I 


IFTE PCIE Texture on a Folygos 


The Normal Map: The 


Incorrect Morrmal Flap 


The Normal Map, The Way 


Hiri Urian Haight "az 


Curect Normal Hap 





练习 


e 在 indexVBO TBN 本 数 中 ， 在 做 加 法 前 把 向 量 注 一 化 ， 看 看 结果 。 
e 用 颜色 可 视 化 其 他 向 量 (如 instance. EyeDirection tangentspace ) ， 试 着 解释 你 看 到 的 结果 。 


工具 和 链接 


Crazybump 制作 法 线 纹理 的 好 工具 ， 收 费 。 

e Nvidia photoshop 插 件 免费 ， 不 过 Photoshop 不 免费 .…… 
。 用 多 幅 照 片 制 作法 线 贴图 

用 单 幅 照片 制作 法 线 贴 

e 天 于 矩阵 转 置 的 详细 资料 


参考 文献 


e Lengyel, Eric. “Computing Tangent Space Basis Vectors for an Arbitrary Mesh”. Terathon Software 
3D Graphics Library, 2001. 

e Real Time Rendering, third edition 

e ShaderX4 


“ 泻 染 到 纹理 "是 一 系列 特效 方法 之 一 。 基 本 思想 是 : 像 通 沼 那样 泻 染 一 个 场景 
用 的 纹理 中 。 





应 用 包括 : 游戏 (in-game) 相机 、 后 期 处 理 (post-processing) 以 及 你 能 想象 到 一 切 . 


我 们 有 三 个 任务 : 创建 要 泻 染 的 纹理 对 象 ; 将 纹理 泻 染 到 对 象 上 ; 使 用 生成 的 纹理 。 


创建 泻 染 目标 (Render Target) 


我 们 要 温 染 的 对 象 叫做 帧 缓存 。 它 像 一 个 容器 ， 用 来 存 纹 理 和 一 个 可 选 的 深度 缓冲 区 (depth buffer)。 在 
OpenGL 中 我 们 可 以 像 创 建 其 他 对 象 一 样 创建 它 : 


// The framebuffer, which regroups 0, 1, or more textures, and 0 or 1 depth buffer. 
GLuint FramebufferName = 0; 

glGenFramebuffers(1, &amp;FramebufferName); 

glBindFramebuffer(GL FRAMEBUFFER, FramebufferName); 


现在 需要 创建 纹理 ， 纹 理 中 包含 着 色 器 的 RGB 输出 。 这 段 代 码 非 党 的 经 典 


// The texture we're going to render to 
GLuint renderedTexture; 
glGenTextures(1, &amp;renderedTexture); 


只 是 这 次 是 ve 到 可 以 重 


// "Bind" the newly created texture : all future texture functions will modify this textu 


glBindTexture(GL TEXTURE 2D, renderedTexture); 


// Give an empty image to OpenGL ( the last &quot;O&quot; ) 
glrexlImage2D(GL TEXTURE 2D, 0,GL RGB, 1024, 768, 0,GL RGB, GL UNSIGNED BYTE, 0); 


// Poor filtering. Needed ! 
glTexParameteri(GL TEXTURE 2D, GL TEXTURE MAG FILTER, GL NEAREST); 
glrTexParameteri(GL TEXTURE 2D, GL TEXTURE MIN FILTER, GL NEAREST); 


nnm 





同时 还 需要 一 个 深度 缓冲 区 (depth buffer) 。 这 是 可 选 的 ， 取 决 于 纹理 中 实际 需要 男 的 未 西 ; 由 于 我 们 泻 


染 的 是 小 猴 Suzanne， 所 以 需要 深度 测试 。 


// The depth buffer 

GLuint depthrenderbuffer; 

glGenRenderbuffers(1, &amp;depthrenderbuffer); 

glBindRenderbuffer(GL RENDERBUFFER, depthrenderbuffer); 
glRenderbufferStorage(GL RENDERBUFFER, GL DEPTH COMPONENT, 1024, 768); 


glFramebufferRenderbuffer(GL FRAMEBUFFER, GL DEPTH ATTACHMENT, GL RENDERBUFFER, depthrend 


加 Eee 


最 后 ， 配 置 fameBuffer。 





// Set "renderedTexture" as our colour attachement #0 
glFramebufferTexture(GL FRAMEBUFFER, GL COLOR ATTACHMENTO, renderedTexture, 0); 


// Set the list of draw buffers. 
GLenum DrawBuffers[2] = (GL COLOR ATTACHMENTO) ; 
glDrawBuffers(1, DrawBuffers); // "1" is the size of DrawBuffers 


这 个 过 程 中 可 能 出 现 一 些 错误 ， 取 决 于 GPU 的 性 能 ; 下 面 是 检查 的 方法 : 


// Always check that our framebuffer is ok 
if(glCheckFramebufferStatus(GL FRAMEBUFFER) != GL FRAMEBUFFER COMPLETE) 
return false; 


泻 染 到 纹理 
温 染 到 纹理 很 直观 。 简 单 地 绑 定 帧 缓存 ， 然 后 像 往 单一 样 男 场 景 。 轻 松 捅 定 ! 


// Render to our framebuffer 
glBindFramebuffer(GL FRAMEBUFFER, FramebufferName) ; 
glViewport(0,0,1024,768); // Render on the whole framebuffer, complete from the lower lef 


eee 


fragment shader 只 需 稍 作 调 整 : 





layout(location = 0) out vec3 color; 


这 意味 看 每 当 修改 变量 “color"” 时 ， 实 际 修改 了 0 号 泻 梁 目标 ; 这 是 因为 之 前 调用 了 
‘glFramebufferTexture(GL FRAMEBUFFER, GL COLOR ATTACHMENTO, renderedTexture, 0); 


注意 : 最 后 一 个 参数 表示 mipmap 的 级 别 ， 这 个 0 和 GL _COLOR _ATTACHMENT0 没 有 任何 关系 。 


使 用 泻 染 出 的 纹理 


我 们 将 画 一 个 简单 的 铺 满 屏幕 的 四 边 形 。 需 要 buffer、shader、1D...... 


// The fullscreen quad's FBO 

GLuint quad VertexArrayID; 
glGenVertexArrays(1, &quad VertexArrayID); 
glBindVertexArray(quad VertexArrayID); 


static const GLfloat g quad vertex buffer data[] = { 
-1.0f, -1.0f, 0.0f, 
10r -1.0f, Of. 
-1.0f, 1.0f, 0.0f, 
-1.0f, 1.0f, 0.0f, 
1.0f, -1.0f, 0.0f, 
1.0f, 1.0f, 0.Of, 


If 


GLuint quad_vertexbuffer; 
glGenBuffers(1, &quad vertexbuffer); 


glBindBuffer(GL ARRAY BUFFER, quad vertexbuffer); 
glBufferData(GL ARRAY BUFFER, sizeof(g quad vertex buffer data), g quad vertex buffer dat 


// Create and compile our GLSL program from the shaders 

GLuint quad programID - LoadShaders( "Passthrough.vertexshader", "SimpleTexture.fragments 
GLuint texID = glGetUniformLocation(quad programID, "renderedTexture"); 

GLuint timeID = glGetUniformLocation(quad programID, "time"); 





// Render to the screen 
glBindFramebuffer(GL FRAMEBUFFER, ©); 
glViewport(0,0,1024,768); // Render on the whole framebuffer, complete from the lower lef 


| —— ÉÀ—Ü yn] 


我 们 用 下 面 这 个 shader 来 画 全 屏 的 四 边 形 : 





#version 330 core 
in vec2 UV; 
out vec3 color; 


uniform sampler2D renderedTexture; 
uniform float time; 


void main(){ 
color = texture( renderedTexture, UV + 0.005*vec2( sin(time+1024.0*UV.x),cos(time+768 


} 
IE 


这 段 代码 只 是 简单 地 采样 纹理 ， 加 上 一 个 随时 间 变 化 的 微小 偏 移 。 


£5 OR 








Fr 
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SUD 

使 用 深度 

在 一 些 情况 下 ， 使 用 已 泻 染 的 纹理 可 能 需要 深度 。 本 例 中 ， 像 下 面 这 样 ， 简 单 地 泻 染 到 纹理 中 : 
glTexlImage2D(GL TEXTURE 2D, 0,GL DEPTH COMPONENT24, ' , 0,GL DEPTH COMPONENT, GL F 


un |———————— 22:2. 9€ 


(24" 是 精度 。 你 可 以 按 需 从 16,24,32 中 选 。 通 常 24 刚 好 ) 








上 面 这 些 已 经 足够 您 起 步 了 。 课程 源码 中 有 完整 的 实现 。 
运行 可 能 有 点 慢 ， 因 为 驱动 无 法 使 用 Hi-Z 这 类 优化 。 
下 图 的 深度 层次 已 经 经 过 手动 “优化”"。 通 常 ， 深 度 纹理 不 会 这 么 清 蜥 。 深 度 纹理 中 ， 近 = Z 接 近 0 = 颜色 


WR 远 = Z 接 近 1 = 颜色 浅 。 
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多 重 采 祥 


能 够 用 多 重 采 样 纹理 来 替代 基础 纹理 : 只 需要 在 C++ 代码 中 将 glTexlImage2D 蔡 换 
为 glTexlImage2DMultisample， 在 fragment shader 中 将 sampler2D/texture 44% 
为 sampler2DMS/texelFetch 。 


但 要 注意 : texelFetch 多 出 了 一 个 参数 ， 表 示 采 样 的 数量 。 换 句 话 说， 就 是 没有 自动 “滤波 ”( 在 多 重 采 样 
中 ， 正 确 的 术语 是 "分辨 率 (resolution) ”) 功能 。 


所 以 需要 你 目 己 解决 多 重 采样 的 纹理 ， 另 外 ， 非 多 重 采 样 纹理 ， 是 多 亏 另 一 个 着 色 器 。 


没有 什么 难点 ， 只 是 体积 庞大 。 


你 可 能 需要 同时 写 多 个 纹理 。 


简单 地 创建 吞 干 纹 理 (都 要 有 正确 、 一 致 的 大 小 1 ) ， 调 用 glFramebufferTexture， 为 每 一 个 纹理 设置 一 个 
不 同 的 color attachement， 用 更 新 的 参数 (如 (2, 

{GL_COLOR_ATTACHMENTO, GL_COLOR_ATTACHMENT1, GL_DEPTH_ATTACHMENT}) 一 样 ) 调用 glDrawBuffers， 然 
后 在 片断 着 色 器 中 多 添加 一 个 输出 变量 : 


layout(location = 1) out vec3 normal_tangentspace; // or whatever 


提示 1 : 如 果真 需要 在 纹理 中 输出 向 量 ， 浮 点 纹理 也 是 有 的 ， 可 以 用 16 或 32 位 精度 代 奉 8 位 .….……. 看 


看 glTexImage2D 的 参考 手册 GSGL FLOAT) 。 提示 2 : 对 于 以 前 版 本 的 OpenGL， 请 使 用 glFragDatal1] 
= myvalue, 


练习 


e 试 使 用 glViewport(0,0,512,768) 代替 glviewport(0,0,1024,768) ; ( 帧 缓存 、 屏 幕 两 种 情况 都 试 
试 ) 

e 在 最 后 一 个 ffagment shader 中 尝试 一 下 用 其 他 UV 坐标 

e 试用 一 个 真正 的 变换 和 矩阵 变换 四 边 形 。 首 先 用 硬 编码 方式 。 然 后 党 试 使 用 controls.hpp PARK 
数 ， 观 察 到 了 什么 现象 ? 


© http://www.opengl-tutorial.org/ 


Written with StackEdit. 


第 十 五 课 : 光照 贴图 (Lightmap) 


这 畦 课 是 视频 课程 ， 没 有 介绍 新 的 OpenGL 相 天 技术 /语法 。 不 过 ， 大 家 会 学 习 如 何 利 用 现 有 知识 ， 生 成 高 
质量 的 阴影 。 


本 课 介 绍 了 用 Blender 创 建 简单 场景 的 方法 ; 还 介绍 了 如 何 烘 培 (bake) 光照 贴图 (lightmap) ， 以 便 在 你 
的 项 目 中 使 用 。 
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无 需 Blender 预 备 知 识 ， 我 会 讲解 包括 快捷 键 的 所 有 内 容 


天 于 光照 贴图 


光照 图 是 永久 、 一 次 性 地 烘焙 好 的 。 也 就 是 说 光照 图 是 完全 静态 的 ， 你 不 能 在 运行 时 移动 光源 ， 连 删除 都 
不 行 。 

但 对 于 阳光 这 种 光源 来 说 ， 光 照 图 还 是 大 有 用 武之 地 的 ; 在 不 会 打 碎 灯泡 的 室内 场景 中 ， 也 是 可 以 的 。 
2009 年 发 布 的 《 镜 之 边缘 》 (Mirror Edge) 室内 、 室 外 场景 中 大 量 采 用 了 光照 图 。 


更 重要 的 是 ， 光 照 图 很 容易 配置 ， 速 度 无 可 匹敌 。 


视频 


个 1024x768 高 清 视频 。 


Youku 标清 合 中 文字 幕 Vimeo 高 清原 版 视频 
MY 3k 


HOpenGLE R, MARS IE AERE GX BWR EMA T ) 
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这 是 由 mipmap 造 成 的 。 从 远 处 观察 时 ，mipmap 对 纹 素 做 了 混合 。 纹 理 背 景 中 的 黑色 像素 点 和 光照 图 中 的 
像 乘 点 混合 在 了 一 起 。 为 了 避免 这 一 点 ， 可 以 采取 如 下 措施 : 


e 让 Blender 在 UV 图 的 limits 上 生成 一 个 margin。 这 个 margin 参 数位 于 bake 面 板 。 要 想 效 果 更 好 ， 可 以 把 
margin 值 设 为 20 个 纹 素 。 
e 获取 纹理 时 ， 加 上 一 个 偏离 (bias) 


color = texture2D( myTextureSampler, UV, -2.0 ).rgb; 


-2 是 偏离 量 。 这 个 值 是 通过 不 红 得 出 的 。 上 面 的 截图 中 bias 值 为 +2， 也 就 是 说 OpenGL 将 在 原本 的 
E (Ae, :XBGKBU1/16, Heitthhez FT) o- 


。 BARBRA RRR ARE, R-RKRMRSBH. 


第 十 六 课 : 阴影 贴图 (Shadow mapping) 


第 十 五 课 中 已 经 学 习 了 如 何 创建 光照 贴图 。 光 照 贴图 可 用 于 静 态 对 象 的 光照 ， 其 阴影 效果 也 很 不 错 ， 但 无 
法 义理 运动 的 对 象 。 


阴影 贴图 是 目前 (截止 2012 年 ) 最 好 的 生成 动态 阴影 的 方法 。 此 法 最 大 的 优点 是 易于 实现 ， 缺 点 是 想 完 全 
正确 地 实现 不 大 容易 。 


本 课 首先 介绍 基本 算法 ， 探 究 其 缺陷 ， 然 后 实现 一 些 优 化 。 — 影 贴 图 技术 还 在 
被 广泛 地 研究 ; 我 们 将 提供 一 些 指 导 ， 以 便 你 根据 自身 需要 ， 进 一 步 改 善 你 的 阴 景 


基本 的 阴影 贴图 


基本 的 阴影 贴图 算法 包含 两 个 步 又。 首先 ， 从 光源 的 视角 将 场景 演 染 一 次 ， 只 计算 每 个 片断 的 深度 。 接 着 
从 正常 的 视角 把 场景 再 泻 染 一 次 ， ‘a Ray E N 斌 当前 片断 是 否 位 于 阴影 


人 否 在 阴影 中 "的 测试 实际 上 非 妆 简单。 如 果 当 前 采样 点 比 阴影 贴图 中 的 同一 点 离 光 源 更 远 ， 那 说 明 场 景 
有 一 个 物体 比 当前 采样 点 离 光源 更 近 ; 即 当 前 片断 位 于 阴影 


下 图 可 以 帮 你 理解 上 述 原理 : 


Distances stored in a texture 
("shadow map") 


Projected shadow 





ve 4 ze BA mn 图 


本 课 只 考虑 平行 光一 一 一 种 位 于 无 限 远 义 ， eed Wea sao d 
影 贴图 。 正 交 投 影 矩 阵 和 一 般 的 透视 投影 矩阵 震 不 多 ， 只 不 
体 的 大 小 看 起 来 都 是 一 样 的 。 





多 远 ， 物 





设置 演 染 目标 和 MVP 和 矩阵 
十 四 课 中 ， 大 家 学 习 了 把 场景 泻 染 到 纹理 ， 以 便 稍 后 从 shader 中 访问 的 方法 。 


这 里 采用 了 一 幅 1024x1024、16 位 深度 的 纹理 来 存储 阴影 贴图 。 对 于 阴 景 te ee sash 
可 以 自由 地 试 试 别 的 数值 。 注 意 ， 这 里 采用 的 是 深度 纹理 ， 而 非 深 度 泻 染 缓冲 区 (这 个 要 留 到 后 面 进行 采 
样 ) 。 


// The framebuffer, which regroups ©, 1, or more textures, and 0 or 1 depth buffer. 
GLuint FramebufferName = 0; 

glGenFramebuffers(1, &FramebufferName) ; 

glBindFramebuffer(GL_FRAMEBUFFER, FramebufferName) ; 


// Depth texture. Slower than a depth buffer, but you can sample it later in your shader 
GLuint depthTexture; 

glGenTextures(1, &depthTexture); 

glBindTexture(GL TEXTURE 2D, depthTexture); 

glTexlImage2D(GL TEXTURE 2D, 0,GL DEPTH COMPONENT16, 1024, 1024, 0,GL DEPTH COMPONENT, GL 
glTexParameteri(GL TEXTURE 2D, GL TEXTURE MAG FILTER, GL NEAREST); 
glTexParameteri(GL TEXTURE 2D, GL TEXTURE MIN FILTER, GL NEAREST); 
glTexParameteri(GL TEXTURE 2D, GL TEXTURE WRAP S, GL CLAMP TO EDGE); 
glTexParameteri(GL TEXTURE 2D, GL TEXTURE WRAP T, GL CLAMP TO EDGE); 


glFramebufferTexture(GL FRAMEBUFFER, GL DEPTH ATTACHMENT, depthTexture, 09); 
glDrawBuffer(GL NONE); // No color buffer is drawn to. 
// Always check that our framebuffer is ok 


if(glCheckFramebufferStatus(GL FRAMEBUFFER) !- GL FRAMEBUFFER COMPLETE) 
return false; 


ER 
MVP 和 矩阵 用 于 从 光源 的 视角 绘制 场景 ， 其 计算 过 程 如 下 : 





e 投影 矩阵 是 正 交 和 矩阵 ， 可 将 整个 场景 包含 到 一 个 AABB (axis-aligned box, 轴 向 包围 盒 ) 里 ， 该 包围 盒 
在 X、Y、Z 轴 上 的 坐标 范围 分 别 为 (-10,10)、(-10,10)、(-10,20)。 这 样 做 是 为 了 让 整个 场景 始终 可 见 ， 
这 一 点 在 "再 进一步 "小 节 还 会 讲 到 。 

e 视图 矩阵 对 场景 做 了 旋转 ， 这 样 在 观察 坐标 系 中 ， 光 源 的 方向 融 是 -Z 方 向 〈 需 要 温习 [第 三 课 ] 

。 模型 矩阵 可 设 为 任意 值 。 


glm: :vec3 rrgntiInyDIr = gim: jvecs (O25 72,2); 


// Compute the MVP matrix from the light's point of view 

glm::mat4 depthProjectionMatrix = glm::ortho<float>(-10,10, -10,10, -10, 20); 

glm::mat4 depthViewMatrix = glm::lookAt(lightInvDir, glm::vec3(0,0,0), glm::vec3(0,1,! 
glm::mat4 depthModelMatrix = glm::mat4(1.0); 

glm::mat4 depthMVP = depthProjectionMatrix * depthViewMatrix * depthModelMatrix; 


// Send our transformation to the currently bound shader, 
// in the "MVP" uniform 
glUniformMatrix4fv(depthMatrixID, 1, GL FALSE, &depthMvP[0][0]) 


a 





Shaders 


这 一 次 泻 染 中 所 用 的 着 色 器 很 简单 。 Are Beis fh BMitA— PMR RBs : 


#version 330 core 


// Input vertex data, different for all executions of this shader. 
layout(location = 0) in vec3 vertexPosition_modelspace; 


// Nalues that stay constant for the whole mesh. 
uniform mat4 depthMVP; 


void main(){ 
gl Position = 


j 


depthMVP * vec4(vertexPosition modelspace,1); 


fragment shader 同 样 简单 : 只 需 将 片断 的 深度 值 写 到 location 0 〈 即 写 人 深度 纹理 ) 。 


#version 330 core 


// Ouput data 
layout(location = 0) out float fragmentdepth; 


void main(){ 


// Not really needed, OpenGL does it anyway 
fragmentdepth = gl FragCoord.z; 


为 只 需 守 入 低 精 度 的 深度 值 ， 不 需要 同时 写 深度 值 和 颜色 


泻 染 阴影 贴图 上 般 的 场景 要 快 一 倍 多 ， 因 
往 是 影 PURA 





颜色 越 深 表示 z 值 越 小 ; 故 墙 面 的 右上 角 离 相机 更 近 。 相 反 地 ， 白 色 表 示 z=1 《〈 齐 次 坐标 系 中 的 值 ) ， 离 相 


使 用 阴影 贴图 


基本 shader 
现在 回 到 普通 的 着 色 器 。 对 于 每 一 个 计算 出 的 fragment， 都 要 测试 其 是 否 位 于 阴影 贴图 之 “后 ”。 


为 了 做 这 个 测试 ， 需 要 计算 : 在 创建 阴影 贴图 所 用 的 坐标 条 中 ， 当 前 片断 的 坐标 。 因 此 要 依次 用 通 
的 mvp 和 矩阵 和 depthMvP 矩阵 对 其 做 变换 。 


不 过 还 需要 一 些 技巧 。 将 depthMVP 和 与 顶点 坐标 相 乘 得 到 的 是 齐 次 坐标 ， 坐 标 范 围 为 [-1,1]， 而 纹理 采样 的 
取 值 范围 却 是 [0,1]。 


举 个 例子 ， 位 于 屏幕 中 央 的 fragment 的 齐 次 坐标 应 该 是 (0,0) ; 但 要 对 纹理 中 心 进行 采样 ，UV 上 坐标 束 应 该 是 
(0.5,0.5)< 


这 个 问题 可 以 通过 在 片断 着 色 器 中 调整 来 样 坐标 来 修正 ， 但 用 下 面 这 个 矩阵 去 乘 齐 次 坐标 则 更 为 高 效 。 这 
个 矩阵 将 坐标 除 以 2 ( 主 对 角 线 上 [-1,1] -> [-0.5, 0.5]) ， 然 后 平移 (最 后 一 行 [-0.5, 0.5] -> [0,1]) 。 


glm::mat4 biasMatrix( 
Qe5 0.00305 O46), 
0D Oe o Ono 
go EO DEED 
G25, 0.57) Ora) 4 0 


glm::mat4 depthBiasMVP = biasMatrix*depthMVP; 


终于 可 以 写 vertex shader 了 。 和 之 前 的 差不多 ， 不 过 这 次 要 输出 两 个 坐标 。 


e gl Position 是 当前 相机 所 在 坐标 系 下 的 顶点 坐标 
e ShadowCoord 是 上 一 个 相机 (光源 ) 所 在 坐标 系 下 的 顶点 坐标 


// Output position of the vertex, in clip space : MVP * position 
gl Position = MVP * vec4(vertexPosition modelspace,1); 


// Same, but with the light's view matrix 
ShadowCoord - DepthBiasMVP * vec4(vertexPosition modelspace,1); 


fragment shader 就 很 简单 了 : 


e texture2D( shadowMap, ShadowCoord.xy ).z 是 光源 到 距离 最 近 的 民 挡 物 之 间 的 距离 。 
e ShadowCoord.z 是 光源 和 当前 片断 之 间 的 距离 


— 因此 ， 知 当前 fragment 比 最 近 的 遮挡 物 还 远 ， 那 意味 看 这 个 片断 位 于 《这 个 最 近 的 遮挡 物 的 ) 阴影 


float visibility = 1.0; 

if ( texture2D( shadowMap, ShadowCoord.xy ).z < ShadowCoord.z)( 
visibility - 0.5; 

j 


我 们 只 需 把 这 个 原理 加 到 光照 计算 中 。 当 然 ， 环 境 光 分 量 无 需 改动 ， 半 竟 这 只 分 量 是 个 为 了 模拟 一 些 光 


55, AREKEA ele PUA RE BCE (SUMS EARS) 。 


color = 
MaterialAmbiantColor + 
visibility * MaterialDiffuseColor * LightColor * LightPower * cosTheta- 


visibility * MaterialSpecularColor * LightColor * LightPower * pow(cosAlpha,5); 


2 R— HRE (Shadow acne) 
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逐一 检查 图 中 的 问题 。 代 码 有 两 个 工程 shadowmaps 和 shadowmaps simple ， 任 选 一 项 。Ssimple 版 的 效 
果 和 上 图 一 样 糟糕 ， 但 代码 比较 容易 理解 。 


问题 


BA 2 TE ae 


Ex BH E AY je] AA ERA ASIE : 


2 2 ; 
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这 种 现象 可 用 下 面 这 张 简 单 的 图 解释 : 
A» 





Lightmap pixels 


通常 的 “补救 措施 "是 加 上 一 个 误差 容 限 (error margin) : 仅 当 当前 fragment 的 深度 (再 次 提醒 ， d 
是 从 光源 的 坐标 系 得 到 的 深度 值 ) 确实 比 光照 贴图 像素 的 深度 要 大 时 ， 才 将 其 判定 为 阴影 。 这 可 以 通过 添 
加 一 个 偏差 (bias) 来 办 到 : 


float bias = 0.005; 

float visibility = 1.0; 

if ( texture2D( shadowMap, ShadowCoord.xy ).z <  ShadowCoord.z-bias) { 
visibility = 0.5; 

j 


效果 好 多 了 : : 
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Rit, Wb AET, ATMAT RE, HSH AMEE SBOE f. BATA, 0.00589 
偏 莽 对 地 面 来 说 太 大 了 ， 但 对 曲面 来 说 又 太 小 了 : BEA AERA LAER A JL. 


一 个 通 弟 的 解决 方案 是 根据 斜率 调整 偏 震 : 


float bias = 4 ( (cosTheta)); 


ARRAS, Bee Hm EENET. 











还 有 一 个 技巧 ， 不 过 这 个 技巧 灵 不 灵 得 看 具体 的 几何 形状 。 此 技巧 只 泻 染 阴影 中 的 背面 。 这 就 对 厚 墙 的 几 
何 形状 提出 了 硬性 要 求 ( 请 看 下 一 节 一 一 阴影 其 空 (Peter Panning) ， 不 过 即使 有 瑕 站 ， 也 只 会 出 现在 阴 
影 庶 和 获 下 的 表面 上 。 【 译 者 注 : 在 迪斯尼 经 典 动画 《小 飞 侠 》 中 ， 小 飞 侠 彼 得 . 潘 的 影子 和 身体 分 开 了 ， 小 


仙女 温 蒂 又 给 他 缝 好 了 。 ] 


wir 
= F 


Fa 


No acne on the 
visible surfaces 






Acne in the dark anyway 


7 2E DÀ RA D s I ER IE TEL BS Te : 


// (if your geometry is made this way) 
glCullFace(GL_FRONT); // Cull front-facing triangles -> draw only back-facing triangl 





Bil 


演 染 场景 时 正常 地 泻 染 AREA) 


glCullFace(GL_BACK); // Cull back-facing triangles -> draw only front-facing triangle 


1 


代码 中 也 用 了 这 个 方法 ， 和 "加 入 偏差? 联合 使 用 。 


Kaa? (Peter Panning) 


am 
am 


现在 没有 阴影 瑕 普 了 ， 但 地 面 的 光照 效果 还 是 不 对 ， 看 上 去 墙 别 好 像 甚 在 半空 (因此 术语 称 为 “ 阴 景 
79") 。 实 际 上 ， 加 上 偏差 会 加 剧 阴 影 基 空 。 


sis 


onde 





这 个 问题 很 好 修正 : 避免 使 用 薄 的 几何 形体 束 行 了 。 这 样 做 有 两 个 好 人 处: 


e 首先 ， (把 物体 增 厚 ) 解决 了 阴影 其 空间 题 : 物体 比 偏 舌 值 要 大 得 多 ， 于 是 一 切 奈 烦 烟 消 云 散 了 
。 其 次 ， 可 在 演 染 光照 贴图 时 启用 背面 吻 除 ， 因 为 现在 ， 墙 壁 上 有 一 个 面 面 对 光源 ， 束 可 以 遮挡 住 墙壁 
NAH, MRA -MISUFAR AMAR f, TRIER, 


Uk RRL SS RAS AIS I (每 帧 多 了 一 倍 的 三 角形 ) 











走样 


即使 是 使 用 了 这 些 技巧 ， 你 还 是 会 发 现 阴 影 的 边缘 上 有 一 些 走样 。 换 句 话 说 ， 就 是 一 个 像素 点 是 白 的 ， 领 
近 的 一 个 像素 点 是 黑 的 ， 中 间 缺 少 平滑 过 渡 。 





PCF (percentage closer filtering， 百 分 比 渐 近 滤波 ) 


一 个 最 简单 的 改善 方法 是 把 阴影 贴图 的 sampler 类 型 改 为 sampler2DShadow 。 这 人 么 做 的 结果 是 ， 每 当 对 阴 
影 贴图 进行 一 次 采样 时 ， 硬 件 融 会 对 相 邻 的 纹 素 进行 采样 ， 并 对 它们 全 部 进行 比较 ， 对 比较 的 结果 做 双 线 
性 滤波 后 返回 一 个 [0,1] 之 间 的 float 值 。 


例如 ，0.5 即 表示 有 两 个 采样 点 在 阴影 中 ， 两 个 采样 点 在 光明 中 。 


注意 ， 它 和 对 滤波 后 深度 图 做 单 次 采样 有 区 别 | 一 次 “比较 ”， 返 回 的 是 true 或 false ; PCF 返 回 的 是 4 个 "true 
或 false" 值 的 插值 结果 
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泊 松 采样 (Poisson Sampling) 


一 个 简易 的 解决 办 法 是 对 阴影 贴图 做 N 次 采样 〈 而 不 是 只 做 一 次 ) 。 并 且 要 和 PCF 一 起 使 用 ， 这 样 即 使 采样 
次 数 不 多 ， 也 可 以 得 到 较 好 的 效果 。 下 面 是 四 次 采样 的 代码 : 


for (int i=0;1i<4;i++){ 
if ( texture2D( shadowMap, ShadowCoord.xy + poissonDisk[i]/700.0 ).z < ShadowCoord.z- 
visibility-=0.2; 





poissonDisk 是 一 个 常量 数组 ， 其 定义 看 起 来 像 这 样 : 


vec2 poissonDisk[4] = vec2[]( 
vec2( -0.94201624, -0.39906216 ), 
vec2( 0.94558609, -0.76890725 ), 
vec2( -0.094184101, -0.92938870 ), 
vec2( 0.34495938, 0.29387760 ) 


这 样 ， 根 据 阴 影 贴 图 采样 点 个 数 的 多 少 ， 生 成 的 fragment 会 随 之 变 明 或 变 瞳 。 











常量 700.0 人 确定 了 采样 点 的 "分散" 程度 。 散 得 太 窗 ， 还 是 会 发 生 走样 ; 获得 太 开 ， 会 出 现 条 带 (截图 中 未 使 
用 PCF， 以 便 让 条 带 现象 更 明显 ; 其 中 做 了 16 次 采样 ) 
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分 层 泊 松 采 样 (Stratified Poisson Sampling) 


过 为 每 个 像素 分 配 不 同 采样 点 个 数 ， 我 们 可 以 ; ek 题 。 主 要 有 两 种 方法 : 分 层 泊 松 法 (Stratified 
nai 和 旋转 泊 松 法 (Rotated Poisson) 。 分 层 泊 松 法 选择 不 同 的 采样 点 数 ; 旋转 泊 松 法 采样 点 数 保 
持 一 致 ， 但 会 做 随机 的 旋转 以 使 采 宁 ee 化 。 本 课 仅 对 分 层 ERE 


与 之 前 版 本 唯一 不 同 的 是 ， 这 里 用 了 一 个 随机 数 来 索引 poissonDisk 


for (int 1=0;1<4;1i++) { 
int index = // A random number between © and 15, different for each pixel (and each 1 
visibility -= 0.2*(1.0-texture( shadowMap, vec3(ShadowCoord.xy + poissonDisk[index]/7 


j 
El == 
可 用 如 下 代码 (返回 一 个 [0,1] 间 的 随机 数 ) 产生 随机 数 





float dot_product = dot(seed4, vec4(12.9898, 78.233,45.164,94.673)); 
return fract(sin(dot product) * 43758.5453); 


APIA, seed4 是 参数 i 和 seed 的 组 成 的 vec4 辐 量 (这 会 是 在 4 个 位 置 做 采样 ) 。 参 数 seed 的 值 可 
以 选用 gl_Fragcoord (像素 的 屏幕 坐标 ) , EX Position worldspace 


// - A random sample, based on the pixel's screen location. 
/ / No banding, but the shadow moves with the camera, which looks weird. 
int index = int(16.0*random(gl FragCoord.xyy, 1))%16; 
// - A random sample, based on the pixel's position in world space. 
VT. The position is rounded to the millimeter to avoid too much aliasing 


//int index = int(16.0*random(floor(Position worldspace.xyz*1000.0), 1))%16; 


这 样 做 之 后 ， 上 图 中 的 那 种 条 带 就 消失 了 ， 不 过 噪点 却 显现 出 来 了 。 不 过 ， 一 此 "漂亮 的 "噪点 可 比 上 面 那些 
RETEST 





上 述 三 个 例子 的 实现 请 参见 tutorial16/ShadowMapping.fragmentshader。 
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即使 把 这 些 技巧 都 用 上 ， 仍 有 很 多 方法 可 以 提升 阴影 质量 。 下 面 是 最 前 见 的 一 些 方 法 : 


早 优 化 (Early bailing) 


不 要 把 采样 次 数 设 为 16， 太 大 了 ， 四 次 来 样 足 矣 。 各 这 四 个 点 都 在 光明 或 都 在 阴影 中 ， AB REEL CR AA 
效果 也 一 样 : 这 束 叫 过 里 优化。 和 在 这些 采 样 点 明暗 各 异 ， 那 你 很 可 能 位 于 阴影 边界 上 ， 这 时 候 进 行 16 次 采 
样 才 是 合 情 理 的 。 


聚光灯 (Spot lights) 


义理 聚光灯 这 种 光源 时 ， 不 需要 多 大 的 改动 。 最 主要 的 是 : TIES RS HABES ABI : 


glm::vec3 lightPos(5, 20, 20); 
glm::mat4 depthProjectionMatrix = glm::perspective<float>(45.0f, 1.0f, 2.0f, 50.0f); 
glm: :mat4 depthViewMatrix = glm::lookAt(lightPos, lightPos-lightInvDir, glm::vec3(0,1,0)) 


EL ëo 


ABA ABS—4E, Hi FHBJTiEIEAXUGRIAPUPRBE, MEER RE A ERRA, KAS 
texture2Dprojo  ( J,"28PUR———3B "AYA ) 





第 二 步 ， 在 shader 中 ， 把 透视 考虑 在 内 。 OU RGR OOP’ BUBATES FMS, BMRPBERAMR 
做 什么 透视 。 这 一 步 是 由 硬件 完成 的 ， 只 是 把 投影 的 坐标 除 以 了 Ww。 这 里 在 着色 器 中 模拟 这 一 步 操 作 ， 因 此 
得 上 自己 做 透视 除法 。 顺 便 说 一 句 ， 正 交 和 矩阵 产生 的 齐 次 同 量 W 始 终 为 1， 这 束 是 为 什么 正 交 和 矩 阵 没 有 任何 通 
视 效 果 。) 





用 GLSL 完 成 此 操作 主要 有 两 种 方法 。 第 二 种 方法 利用 了 内 置 的 textureProj 男 数 ， 但 两 种 方法 得 出 的 效 
果 是 一 样 的 。 


if ( texture( shadowMap, (ShadowCoord.xy/ShadowCoord.w) ).z < (ShadowCoord.z-bias)/Shad 
if ( textureProj( shadowMap, ShadowCoord.xyw ).z < (ShadowCoord.z-bias)/ShadowCoord.w ) 


fo EET iT) 
点 光源 (Point lights) 


大 部 分 是 一 样 的 ， 不 过 要 做 深度 立方 体贴 图 (cubemap) 。 立 方 体贴 图 包含 一 组 6 个 纹理 ， 每 个 纹理 位 于 立 
方 体 的 一 面 ， 无 法 用 标准 的 UV 坐标 访问 ， 只 能 用 一 个 代表 方向 的 三 维 向 量 来 访问 。 





空间 各 个 方向 的 深度 都 保存 着 ， 保 证 点 光源 各 方向 都 能 投射 影子 
多 个 光源 组 合 


该 算法 可 以 处 理 多 个 光源 ， 但 别 氢 了， 每 个 光源 都 要 做 一 次 演 染 ， 以 生成 其 阴影 贴图 。 这 些 计算 极 大 地 消 
耗 了 显存 ， 也 许 很 快 你 的 显卡 带宽 就 吃紧 了 。 


自动 光源 四 棱锥 (Automatic light frustum) 


本 课 中 ， 训 括 整 个 场景 的 光源 四 校 锥 是 手动 算出 来 的 。 哩 然 在 本 课 的 限定 条 件 下 ， 这 么 做 还 行 得 通 ， 但 应 
该 避免 这 样 的 做 法 。 如 果 你 的 地 图 大 小 是 1Km x 1Km， 你 的 阴影 贴图 大 小 为 1024x1024， 则 每 个 纹 素 代 表 
的 面积 为 1 平方 米 。 这 人 么 做 太 敬 脚 了 。 光 源 的 投影 矩阵 应 尽量 紧 包 整个 场景 。 


对 于 聚光灯 来 说 ， 只 需 调整 一 下 范围 就 行 了 。 


对 于 太阳 这 样 的 方 同 光源 ， 情 况 束 复杂 一 些 : 光源 确实 照 完 了 整个 场景 。 以 下 是 计算 方向 光源 视 域 四 棱锥 
的 一 种 方法 : 


潜在 阴影 接收 者 (Potential Shadow Receiver, flesh : 司 时 在 【光源 视 域 
四 棱锥 ， 观 察 视 域 四 棱锥 ， 以 及 场景 包围 使】 这 三 者 之 内 。 顾 名 思 义 ，PSR 都 有 可 能 位 于 阴影 中 : 相机 和 
光源 都 能 Hb “看 到 它 Ko 





潜在 阴影 投射 者 (Potential Shadow Caster, PSC) = PSR + 所 有 位 于 PSR 和 光源 之 间 的 物体 (一 个 物体 
可 能 不 可 见 但 仍然 会 投射 出 一 条 可 见 的 阴影 


因此 ， 要 计算 光源 的 投影 算 阵 ， 可 以 用 所 有 可 见 的 物体 ,“ 减 去 "那些 离 得 太 远 的 物体 ， 再 计算 其 包围 会 ; 然 
后 “加 上 "位 于 包围 盒 与 广元 之 间 的 物体 ， 再 次 计算 新 的 包围 盒 〈 不 过 这 次 是 治 看 光源 的 方向 ) 。 


这 些 集 合 的 精确 计算 涉及 凸 包 体 的 求 交 计算 ， 但 这 个 方法 (计算 包围 金 ) 实 现 起 来 简单 多 了 。 


此 法 在 物体 离开 视 域 四 棱锥 时 ， 计 算 量 会 陡 增 ， 原 因 在 于 阴影 贴图 的 分 辩 率 陡然 增加 了 。 你 可 以 通过 多 次 
平滑 插值 来 弥补 。CSM (Cascaded Shadow Map， 层 县 阴影 贴图 法 ) 无 此 问题 ， 但 实现 起 来 较 难 。 


指数 阴影 贴图 (Exponential shadow map) 


指数 阴影 贴图 法 试图 借助 “位 于 阴影 中 的 、 但 离 光 源 较 近 的 片断 实际 上 人 处 于 ' 某 个 中 间 位 置 " 这 一 假设 来 减少 
走样 。 这 个 方法 涉及 到 偏差 ， 不 过 测试 已 不 再 是 二 元 的 : 片断 离 明 亮 曲 面 的 距离 越 远 ， 则 其 越 显 得 黑暗 。 


显然 ， 这 纯粹 是 一 种 障 眼 法 ， 两 物体 重合 时 ， 瑕 兹 整 会 显露 出 来 。 


LiSPSM (Light-space perspective Shadow Map， 光 源 空间 透视 阴影 贴 
图 ) 


LiSPSM 调 整 了 光源 投影 矩阵 ， 从 而 在 离 相 机 很 近 时 获取 更 高 的 精度 。 这 一 点 在 “duelling frustra" 现 象 发 生 

时 显得 尤为 重要 。 所 谓 “duelling frustra" 是 指 : 点 光源 与 你 (相机) 距离 远 ， 【视线 由 方向 又 恰好 与 你 的 视 

E ae 阴影 贴图 精度 高 ; 离 光 源 远 的 地 方 〈 即 离 你 近 的 地 方 ， 你 
需要 精确 阴影 贴图 的 地 方 ) ， 阴 影 贴 图 的 精度 又 不 够 了 


不 过 LiSPSM 实 现 起 来 很 难 。 详 细 的 实现 方法 请 看 参考 文献 。 


CSM (Cascaded shadow map, Æ BAA) CSM 和 LiSPSM 解 决 的 问题 一 模 一 样 ， 但 方式 不 同 。 
CSM 人 反对 观察 视 域 四 棱锥 的 各 部 分 使 用 了 2~4 个 标准 阴影 贴图 。 第 一 个 阴影 贴图 处 理 近 久 的 物体 ， 所 以 在 
近 处 这 块 小 区 域内 ， 你 可 以 获得 很 高 的 精度 。 随 后 几 个 阴影 贴图 处 理 远 一 些 的 物体 。 最 后 一 个 阴影 贴图 处 
理 场景 中 的 很 大 一 部 分 ， 但 由 于 透视 效应 ， 视 觉 感 官 上 没有 近 处 区 域 那 么 明显 。 


撰写 本 文 时 ，CSM 是 复杂 度 /质量 比 最 好 的 方法 。 很 多 案例 都 选用 了 这 一 解决 方案 。 


CS 


~ 


正如 您 所 看 到 的 ， 阴 影 贴图 技术 是 个 很 复杂 的 课题 。 每 年 都 有 新 的 方法 和 改进 方案 发 表 。 但 目前 为 止 尚 无 
完美 的 解决 方案 


幸运 的 是 ， 大 部 分 方法 都 可 以 混合 使 用 : 在 LiSPSM 中 使 用 CSM， 再 加 PCF 平 滑 等 等 是 完全 可 行 的 。 尽 情 
地 实验 吧 。 


总 结 一 句 ， 我 建议 您 坚持 尽 可 能 使 用 预计 算 的 光照 贴图 ， 只 为 动态 物体 使 用 阴影 贴图 。 并 且 要 确保 两 者 的 
视觉 效果 协调 一 致 ， 任 何 一 者 效果 太 好 / 太 坏 都 不 合适 。 


Abe eg hs 
第 十 七 课 : hese 
虽然 本 课 有 些 超 出 OpenGL 的 范围 ， 但 是 解决 了 一 个 党 见 问题 : 怎样 表示 旋转 ? 


《第 三 课 : 和 矩阵》 中 ， 我 们 了 解 到 和 矩阵 可 以 让 点 绕 某 个 轴 旋 转 。 和 矩阵 可 以 简洁 地 表示 顶点 的 变换 ， 但 使 用 
难度 较 大 : 例如 ， 从 最 终结 果 中 获取 旋转 轴 束 很 闵 烦 。 


本 课 将 展示 两 种 最 常见 的 表示 旋转 的 方法 : 欧 拉 角 (Euler angles) 和 四 元 数 (Quaternion) 。 最 重要 的 
是 ， 本 课 将 详细 解释 为 何 要 尽量 使 用 四 元 数 。 
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[à Euler settin gs ivi Quaternion settings 


are X 0.01 - Quaternion y={x:0.1 
Euler d 38.3 


Euler Z 0.0 0 
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Pos Z 0.0 Quat X 
Quat Y 
Quat Z 
Quat S 

Use LookAt 
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旋转 与 朝向 (orientation) 

阅读 有 关 旋 转 的 文献 时 ， 你 可 能 会 为 其 中 的 术语 感到 困惑 。 本 课 中 : 
e “HA zz JA A. : 该 物体 的 朝 同 为 .……. 

o “HEF ERF : 旋转 该 物体 


ei, SRR EN, MAS SMA. 两 者 形式 相同 ， 因 此 容易 混淆 。 闲 话 少 扳 ， 开 始 进 


RR Fl fe 


欧 拉 和 角 是 表示 朝向 的 最 简 方 法 ， 只 需 存 储 绕 X、Y、Z 轴 旋转 的 角度 ， 非 常 容易 理解 。 你 可 以 用 vec3 来 存储 
一 个 欧 拉 角 : 


vec3 EulerAngles( RotationAroundXInRadians, RotationAroundYInRadians, RotationAroundZInRa 
SSS | 


这 三 个 旋转 是 依次 施加 的 ， 通 党 的 顺序 是 : Y-Z-X (但 并 非 一 定 要 按照 这 种 顺序 ) 。 顺 序 不 同 ， 产 生 的 结果 
也 不 同 。 





游戏 角色 不 会 绕 X 和 Z 轴 旋转 ， 仅 仅 绕 竖 直 的 Y 轴 


一 个 欧 拉 角 的 简单 应 用 融 是 用 于 设置 角色 的 旨 同 。 通 彰 ， 
变量 表示 方向 即 可 。 


旋转 。 因此 ， 无 需 人 处 理 三 个 朝向 ， 只 需 用 一 个 float 型 


一 个 使 用 欧 拉 角 的 例子 是 FPS 相 机 : 用 一 个 角度 表示 头 部 朝向 ( 绕 Y 轴 ) ， 一 个 角度 表示 俯仰 〈 绕 X 
45) o 1A common/controls.cpp 的 示例 。 


不 过 ， 面 对 更 加 复 条 的 情况 时 ， 欧 拉 角 融 显 得 力不从心 了 。 例 如 : 


e 对 两 个 朝向 进行 插值 比较 困难 。 简 单 地 对 X、Y、Z 角 度 进 行 插值 得 到 的 结果 不 太 理 想 。 

实施 多 次 旋转 很 复杂 且 不 精确 : 必须 计算 出 最 终 的 旋转 矩阵， 然后 据 此 推测 书 欧 拉 角 。 

e “RZA DA $ 56r (Gimbal Lock) 问 题 有 时 会 让 旋转 “ 卡 死 "其 他 一 些 奇异 状态 还 会 导致 模型 方 
向 翻转 。 

i ee 

。 容易 出 错 一 般 的 旋转 顺序 是 YZX， 如 果 用 了 非 YZX 顺 序 的 库 ， 就 有 麻烦 了 。 

e 某 些 操作 很 复杂 : in EXER d fie FEN S RE. 





四 元 数 是 表示 旋转 的 好 工具 ， 可 解决 上 述 问 题 。 
四 元 数 
四 元 数 由 4 个 数 [x y z W] 构 成 ， 表 示 了 如 下 的 旋转 : 


// RotationAngle is in radians 


x = RotationAxis.x * sin(RotationAngle / 2) 
y = RotationAxis.y * sin(RotationAngle / 2) 
Z = RotationAxis.z * sin(RotationAngle / 2) 
w = cos(RotationAngle / 2) 


RotationAxis ， 顾 名 思 义 即 旋 转轴 。 RotationAngle 是 旋转 的 角度 。 


Rotation axis 





Rotation angle 


因此 ， 四 元 数 实际 上 存储 了 一 个 旋转 轴 和 一 个 施 转 角度 。 这 让 旅 转 的 组 合 变 简单 了 。 
解读 四 元 数 


四 元 数 的 形式 当然 不 如 欧 拉 角 直 观 ， 不 过 还 是 能 看 懂 的 : xyz 分 量 大 致 代 表 了 各 个 轴 上 的 旋转 分 量 ， 而 
WwW=acos( 旋 转角 度 /2)。 举 个 例子 ， 假 设 你 在 调试 器 中 看 到 了 这 样 的 值 [ 0.7 0 0 0.7 ]。x=0.7， 比 y、z 的 大 ， 
因此 主要 是 在 绕 X 轴 旋转 ; 而 2*acos(0.7) = 1.59 弧 度 ， 所 以 旋转 角度 应 该 是 90°。 


同 理 ，[0 0 0 1] (w=1) 表 示 旋 转角 度 = 2acos(1) = 0， 因 此 这 是 一 个 单位 四 元 数 * (unit quaternion) ， 表 示 
没有 旋转 。 


基本 操作 


不 必 理 解 四 元 数 的 数学 原理 : 这 种 表示 方式 太 隆 涩 了 ， 因 此 我 们 一 般 通 过 一 些 工 具 副 数 进行 计算 。 如 果 对 
这 些 数 学 原理 感 兴趣 ， 可 以 参考 实用 工具 和 链接 中 的 数学 书 头 。 


怎样 用 C++ 创 建 四 元 数 ? 


// Don't forget to #include <glm/gtc/quaternion.hpp> and <glm/gtx/quaternion.hpp> 


// Creates an identity quaternion (no rotation) 
quat MyQuaternion; 


// Direct specification of the 4 components 
// You almost never use this directly 
MyQuaternion = quat(w,Xx,y,Z); 


// Conversion from Euler angles (in radians) to Quaternion 
vec3 EulerAngles(90, 45, 0); 
MyQuaternion - quat(EulerAngles); 


// Conversion from axis-angle 
// In GLM the angle must be in degrees here, so convert it. 
MyQuaternion - gtx::quaternion::angleAxis(degrees(RotationAngle), RotationAxis); 


怎样 用 GLSL 创 建 四 元 数 ? 


不 要 在 shader 中 创建 四 元 数 。 应 该 把 四 元 数 转换 为 旋转 具 阵 ， 用 于 模型 矩阵 中 。 顶 点 会 一 如 既往 地 随 着 
MVP 和 矩阵 的 变化 而 旋转 。 


革 些 情况 下 ， 你 可 能 确实 需要 在 shader 中 使 用 四 元 数 。 例 如 ，GPU 骨 骼 动画 。GLSL 中 没有 四 元 数 类 型 ， 但 
是 可 以 将 四 元 数 存 在 vec4 变 量 中 ， 然 后 在 shader 中 计算 。 


怎样 把 四 元 数 转换 为 矩阵 ? 


mat4 RotationMatrix = quaternion::toMat4(quaternion); 


xR A LURES — HE BT: 


mat4 RotationMatrix = quaternion::toMat4(quaternion); 


mat4 ModelMatrix = TranslationMatrix * RotationMatrix * ScaleMatrix; 
// You can now use ModelMatrix to build the MVP matrix 


Ab 2v zs HAR 7r yg ? 


在 欧 拉 角 和 四 元 数 之 间作 选择 还 真 不 容易 。 欧 拉 角 对 于 美工 来 说 显得 很 直观 ， 因 此 如 果 要 做 一 歌 3D 编 辑 
器 ， 请 选用 欧 拉 角 。 但 对 程序 员 来 涪 ， 四 元 数 却 是 最 方便 的 。 所 以 在 写 3D 引 擎 内 核 时 应 该 选用 四 元 数 。 


一 个 普通 的 共识 是 : 在 程序 内 部 使 用 四 元 数 ， 在 需要 和 用 户 交 互 的 地 方 束 用 欧 拉 骨 。 


这 样 ， 在 处 理 各 种 问题 时 ， 你 才能 得 心 应 手 (至 少 会 轻松 一 点 ) 。 如 果 确 有 必要 (如 上 文 所 述 的 FPS 相 
机 ， 设 置 角 色 朝 同等 情况 ) ， 不 妨 融 用 欧 拉 角 ， 附 加 一 些 转换 工作 。 


其 他 资源 


1. 实用 工具 和 链接 中 的 书籍 
2. 老 是 老 了 点 ，《 游 戏 编程 精粹 1》 (Game Programming Gems I) 有 几 篇 关于 四 元 数 的 好 文章 。 也 许 
网 络 上 就 有 这 份 资料 。 


3， 一 个 关于 旋转 的 [GDC 报 告 ]http://www.essentialmath.com/GDC2012/GDC2012 JMV. Rotations.pdf 


4. The Game Programing Wik! Quaternion tutorial 
. Ogre3D FAQ on quaternions。 第 二 部 分 大 多 是 针对 OGRE 的 。 
. Ogre3D Vector3D.h 和 Quaternion.cpp 


速 查 手册 


oO Ol 


怎样 判断 两 个 四 元 数 是 否 相 同 ? 


十 分 相似 : 


float matching = quaternion::dot(qi, q2); 
if ( abs(matching-1.0) < 0.001 ){ 
// qi and q2 are similar 


j 


由 点 积 的 acos 值 还 可 以 得 到 q1 和 q2 间 的 夹 角 。 


/LN 怎样 旋转 一 个 =l ? 


方法 如 下 : 


rotated_point = orientation_quaternion * point; 


wee: (AUR BitRRE at, MaCHRRRARE. ER, REND ORAS RM. WRB IB 
P : 


rotated point = origin + (orientation quaternion * (point-origin)); 


怎样 对 两 个 四 元 数 插值 ? 


SLERP 意 为 球面 线性 插值 (Spherical Linear intERPolation) 、 可 以 用 GLM 中 的 mix 函数 进行 SLERP : 


glm::quat interpolatedquat = quaternion::mix(quati, quat2, 0.5f); // or whatever factor 
Lee ————————— e] 
个 
怎样 累积 两 个 施 转 ? 


只 需 将 两 个 四 元 数 相 乘 即 可 。 顺序 和 和 矩阵 乘法 一 致 。 亦 即 逆 序 相 乘 : 


quat combined rotation = second rotation * first rotation; 


怎样 计算 两 向 量 之 间 的 旋转 ? 
(也 就 是 说 ， 四 元 数 得 把 v1 旋转 到 v2) 
基本 思路 很 简单 : 


e 两 向 量 间 的 夹 角 很 好 找 : 由 点 积 可 知 其 cos 值 。 
e 旋转 轴 很 好 找 : 两 向 量 的 又 乘 积 。 


如 下 的 算法 束 是 依照 上 述 思 路 实现 的 ， 此 外 还 处 理 了 一 些 特例 : 


quat RotationBetweenVectors(vec3 start, vec3 dest){ 
start = normalize(start); 
dest = normalize(dest); 


float cosTheta = dot(start, dest); 
vec3 rotationAxis; 


if (cosTheta < -1 + 0.001f){ 
// special case when vectors in opposite directions: 
// there is no "ideal" rotation axis 
// So guess one; any will do as long as it's perpendicular to start 
rotationAxis = cross(vec3(0.0f, 0.0f, 1.0f), start); 
if (gtx: :norm::length2(rotationAxis) < 0.01 ) // bad luck, they were parallel, tr 
rotationAxis = cross(vec3(1.0f, O.O0f, 0O.0f), start); 


rotationAxis - normalize(rotationAxis); 
return gtx::quaternion::angleAxis(180.0f, rotationAxis); 


rotationAxis - cross(start, dest); 


float s = sqrt( (1-*cosTheta)*2 ); 
float invs = 1 / s; 


return quat( 
S o- bp 
rotationAxis.x * invs, 
rotationAxis.y * invs, 
rotationAxis.z * invs 


» 





(可 在 common/quaternion utils.cpp P EI:2 KR) 


我 需要 一 个 类 似 gluLookAt 的 函数 。 怎 样 施 转 物 体 使 之 朝向 某 点 ? 


调用 RotationBetweenVectors ENR | 


// Find the rotation between the front of the object (that we assume towards +z, 
// but this depends on your model) and the desired direction 
quat roti = RotationBetweenVectors(vec3(0.0f, 0.0f, 1.0f), direction); 


现在 ， 你 也 许 想 让 物体 保持 坚 直 : 


// Recompute desiredUp so that it's perpendicular to the direction 
// You can skip that part if you really want to force desiredUp 
vec3 right = cross(direction, desiredUp); 

desiredUp = cross(right, direction); 


// Because of the irst rotation, the up is probably completely screwed up. 
// Find the rotation between the "up" of the rotated object, and the desired up 


vec3 newUp = roti * vec3(0.0f, 1.0f, 0.0f); 
quat rot2 = RotationBetweenVectors(newUp, desiredUp); 


组 合 到 一 起 : 


quat targetOrientation = rot2 * roti; // remember, in reverse order. 


注意 , “directions EHA, FIER eS ! 你 可 以 轻松 计算 出 方向 : targetPos - currentPos o 
得 到 目标 朝向 后 ， 你 很 可 能 想 对 startorientation 和 targetorientation 进行 插值 


(可 在 common/quaternion utils.cpp 中 找到 此 函数 。) 


怎样 使 用 LookAt 且 限制 旋转 速度 ?9 


基本 思想 是 采用 SLERP (用 glm: :mix BX) ， 但 要 控制 插值 的 幅度 ， 避 免 角 度 偏 大 。 


float mixFactor = maxAllowedAngle / angleBetweenQuaternions; 
quat result = glm::gtc::quaternion::mix(qi1, q2, mixFactor); 


如 下 是 更 为 复杂 的 实现 。 该 实现 处 理 了 许多 特例 。 注 意 ， 出 于 优化 的 目的 ， 代 码 中 并 未 使 用 mix HA 


quat RotateTowards(quat gi, quat q2, float maxAngle){ 


if( maxAngle < 0.001f ){ 
// No rotation allowed. Prevent dividing by © later. 
recurn ol 


float cosTheta = dot(q1, q2); 


// q1 and q2 are already equal. 
// Force q2 just to be sure 
if(cosTheta > 0.9999f){ 

return g2; 


// Avoid taking the long path around the sphere 
if (cosTheta < 0){ 

qi = qi*-1.0f; 

cosTheta *= -1.0f; 


float angle - acos(cosTheta); 


// If there is only a 2° difference, and we are allowed 5°, 
// then we arrived. 
if (angle < maxAngle) { 

recurn gz; 


float fT = maxAngle / angle; 
angle = maxAngle; 
quat res = (sin((1.0f - fT) * angle) * qi + sin(fT * angle) * q2) / sin(angle); 


res = normalize(res); 
return res; 


可 以 这 样 用 RotateTowards PNRM : 


CurrentOrientation = RotateTowards(CurrentOrientation, TargetOrientation, 3.14f * deltaTi 
DJ m— M—————————————————————— 2207 


(可 在 common/quaternion utils.cpp 中 找到 此 函数 ) 
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第 十 八 课 : Billbard 和 粒子 


公告 板 是 3D 世 界 中 的 2D 元 素 。 它 既 不 是 最 顶层 的 2D 菜 单 ， 也 不 是 可 以 随意 转动 的 3D 平 面 ， 而 是 介 于 两 者 
之 间 的 一 种 元 素 ， 上 比如 游戏 中 的 血 条 。 


公告 板 的 独特 之 处 在 于 : 它 位 于 某 个 特定 位 置 ， 朝 向 是 自动 计算 的 ， 这 样 它 就 能 始终 面向 相机 (观察 
#) . 


方案 1:2D 法 
2D 法 十 分 简单 。 只 需 计 算出 点 在 屏幕 空间 的 坐标 ， 然 后 在 该 处 显示 2D 文 本 (参见 第 十 一 课 ) 即 可 。 


// Everything here is explained in Tutorial 3 ! There's nothing new. 

glm::vec4 BillboardPos worldspace(x,y,z, 1.0f); 

glm::vec4 BillboardPos screenspace - ProjectionMatrix * ViewMatrix * BillboardPos worldsp 
BillboardPos screenspace /- BillboardPos screenspace.w; 


if (BillboardPos screenspace.z < 0.0f)( 
// Object is behind the camera, don't display it. 


j 
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2D 法 优点 是 简单 易 行 ， 无 论点 与 相机 距离 远近 ， 公 告 板 始 终 保持 大 小 不 变 。 但 此 法 总 是 把 文本 显示 在 最 顶 
层 ， 有 可 能 会 谴 挡 其 他 物体 ， 影 响 演 染 效果 。 


方案 2:3D 法 


与 2D 法 相 比 ，3D 法 弟弟 效果 更 好 ， 也 没 复 杂 多 少 。 我 们 的 目的 就 是 无 论 相机 如 何 移动 ， 都 要 让 公告 板 网 
格 正 对 着 相机 : 





可 将 此 视 为 模型 矩阵 的 构造 问题 之 简化 版 。 基 本 思路 是 将 公告 板 的 各 角落 置 于 (FA) The idea is 
that each corner of the billboard is at the center position, displaced by the camera’s up and right vectors : 


Camera space 





This point is translated 
by the camera's UP vector 






Billboard center 


Rest of the scene 





World space 
当然 ， 我 们 仅仅 知道 世界 空间 中 的 公告 板 中 心 位 置 ， 因 此 还 需要 相机 在 世界 空间 中 的 up/right 向 量 。 


在 相机 空间 ， 相 机 的 up 同 量 为 (0,1,0)。 要 把 up 同 量变 换 到 世界 空间 ， 只 需 乘 以 观察 矩阵 的 敢 和 矩阵 (由 相机 
ZE jg] 3 e ze TH ARE Ij] VBE) 。 


用 数学 公式 表示 即 : 
CameraRight_worldspace = {ViewMatrix[O][O], ViewMatrix[1][0], ViewMatrix[2][O]] CameraUp worldspace 


= {ViewMatrix[O][1], ViewMatrix[1][1], ViewMatrix[2][1]} 


接 下 来 ， 顶 点 坐标 的 计算 融 很 简单 了 : 


vec3 vertexPosition_worldspace = 
particleCenter_wordspace 
+ CameraRight_worldspace * squareVertices.x * BillboardSize.x 
+ CameraUp_worldspace * squareVertices.y * BillboardSize.y; 


e particleCenter_worldspace 顾名思义 即 公告 板 的 中 心 位 置 ， 以 vec3 类 型 的 uniform 变 量 表 示 。 

e squareVertices 是 原始 的 网 格 。 左 顶点 的 squarevertices.x 为 -0.5 (4844) , which are thus 
moved towars the left of the camera (because of the *CameraRight_worldspace) 

e BillboardSize 是 公告 板 大 小 ， 以 世界 单位 为 单位 ，uniform 变 量 。 


效果 如 下 。 怎 么 样 ， 是 不 是 很 简单 ? 





为 了 保证 内 容 完整 性 ， 这 里 给 出 squarevertices 的 数据 : 


// The VBO containing the 4 vertices of the particles. 
static const GLfloat g_vertex_buffer_data[] = { 

-0 oT -0. 50, 0.01, 

0.51, OSF O-OT, 
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方案 3 : 固定 大 小 3D 法 


正如 上 面 所 看 到 的 ， 公 告 板 大 小 随 看 相机 与 之 的 距离 变化 。 有 些 情况 下 的 确 需 要 这 样 的 效果 ， 但 血 条 这 类 
公告 板 则 需要 保持 大 小 不 变 。 


vertexPosition worldspace = particleCenter_wordspace; 

// Get the screen-space position of the particle's center 
gl Position = VP * vec4(vertexPosition_worldspace, 1.0f); 
// Here we have to do the perspective division ourselves. 
gl Position /- gl Position.w; 


// Move the vertex in directly screen space. No need for CameraUp/Right worlspace here. 
gl Position.xy += squareVertices.xy * vec2(0.2, 0.05); 


[S B 





方案 4 : Bibl SEE E Tie He A 


一 些 引擎 以 公告 板 表 示 远 处 的 树 和 灯 。 不 过 ， 这 些 树 可 不 能 任意 转向 ， 必 须 是 坚 直 的 。So you need an 


hybrid system that rotates only around one axis. (存疑 待 查 ) 


粒子 (Particles) 与 实例 (Instancing) 


粒子 与 3D 公 告 板 很 类 似 。 不 过 ， 粒 子 有 如 下 四 个 特点 : 
。 数量 较 大 
e 可 以 运动 
。 BEA 
。 半 透 明 


伴随 这 些 特点 而 来 的 是 一 系列 问题 。 本 课 仅 介绍 其 中 一 种 解决 方案 ， 其 他 解决 方案 还 多 看 呢 


一 大 波 粒 子 正在 接近 中 .……. 


首先 想到 的 思路 就 是 套用 上 一 课 的 代码 ， 调 用 glDrawArrays 逐个 绘制 粒子 。 这 可 不 是 个 好 办 法 。 因 为 这 


种 思路 意味 着 你 那 经 光 瓦 亮 的 GTX 512 显 卡 一 次 只 能 绘制 一 个 四 边 形 (很 明星 ， 性 能 损失 高 
这 么 一 个 接 一 个 地 绘制 公告 板 。 


显然 ， 我 们 得 一 次 性 绘制 所 有 的 粒子 。 
方法 有 很 多 种 ， 如 下 是 其 中 三 种 : 


e 生成 一 个 VBO， 将 所 有 粒子 置 于 其 中 。 简 单 ， 有 效 ， 在 各 种 平台 上 均 可 行 。 
e 使 用 geometry shader。 这 不 在 本 教程 范围 内 ， 主 要 是 因为 50% 的 机 器 不 文 持 该 特性 。 
e 使 用 实例 (instancing) 。 大 部 分 机 器 都 支持 该 特性 。 


本 课 将 采用 第 三 种 方法 。 这 种 方法 兼 具 性 能 优势 和 普 适 性 ， 更 重要 的 是 ， 如 果 此 法 行 得 通 ， 
tasse n Ae T. 
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那 第 一 种 方法 


实例 
“实例 ”的 意思 是 以 一 个 网 格 (比如 本 课 中 由 两 个 三 角形 组 成 的 四 边 形 ) 为 蓝本 ， 创 建 多 个 该 网 格 的 实例 。 
具体 地 讲 ， 我 们 通过 如 下 一 些 buffer 实 现 instancing : 


。 一 部 分 用 于 挡 述 原始 网 格 
。 一 部 分 用 于 摘 述 各 实例 的 特性 


这 些 buffer 的 内 容 可 自行 选择 。 在 我 们 这 个 简单 的 例子 包含 了 : 


e 一 个 网 格 顶 点 buffer。 没 有 index buffer， 因 此 一 共有 6 个 vec3 变量 ， 构 成 两 个 三 角形 ， 进 而 组 合成 一 
个 四 边 形 。 

e 一 个 buffer 存 储 粒 子 的 中 心 。 

e 一 个 buffer 存 储 粒 子 的 颜色 。 


这 些 buffer 都 是 标准 buffer。 创 建 方式 如 下 : 


// The VBO containing the 4 vertices of the particles. 
// Thanks to instancing, they will be shared by all particles. 
static const GLfloat g_vertex_buffer_data[] = { 

oss MEO oto ol. 
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GLuint billboard vertex buffer; 
glGenBuffers(1, &billboard vertex buffer); 
glBindBuffer(GL ARRAY BUFFER, billboard vertex buffer); 
glBufferData(GL ARRAY BUFFER, sizeof(g vertex buffer data), g vertex buffer data, GL STAT 


// The VBO containing the positions and sizes of the particles 

GLuint particles position buffer; 

glGenBuffers(1, &particles position buffer); 

glBindBuffer(GL ARRAY BUFFER, particles position buffer); 

// Initialize with empty (NULL) buffer : it will be updated later, each frame. 
glBufferData(GL ARRAY BUFFER, MaxParticles * 4 * sizeof(GLfloat), NULL, GL STREAM DRAW); 


// The VBO containing the colors of the particles 

GLuint particles color buffer; 

glGenBuffers(1, &particles color buffer); 

glBindBuffer(GL ARRAY BUFFER, particles color buffer); 

// Initialize with empty (NULL) buffer : it will be updated later, each frame. 
glBufferData(GL ARRAY BUFFER, MaxParticles * 4 * sizeof(GLubyte), NULL, GL STREAM DRAW); 


Hj Sana ees] 
粒子 更 新 方法 如 下 : 





// Update the buffers that OpenGL uses for rendering. 

// There are much more sophisticated means to stream data from the CPU to the GPU, 
// but this is outside the scope of this tutorial. 

// http://www.opengl.org/wiki/Buffer Object Streaming 


glBindBuffer(GL ARRAY BUFFER, particles position buffer); 
glBufferData(GL ARRAY BUFFER, MaxParticles * 4 * sizeof(GLfloat), NULL, GL STREAM DRAW); 
glBufferSubData(GL ARRAY BUFFER, ©, ParticlesCount * sizeof(GLfloat) * 4, g particule pos 


glBindBuffer(GL ARRAY BUFFER, particles color buffer); 
glBufferData(GL ARRAY BUFFER, MaxParticles * 4 * sizeof(GLubyte), NULL, GL STREAM DRAW); 
glBufferSubData(GL ARRAY BUFFER, 0, ParticlesCount * sizeof(GLubyte) * 4, g particule col 


Hm] 


绘制 之 前 还 需 绑 定 buffer。 绑 定 方 法 如 下 : 





// irst attribute buffer : vertices 
glEnableVertexAttribArray(0); 
glBindBuffer(GL ARRAY BUFFER, billboard vertex buffer); 
glVertexAttribPointer( 

©, // attribute. No particular reason for ©, but must match the layout in the shader. 
3, // size 

GL FLOAT, // type 

GL FALSE, // normalized? 

0, // stride 

(void*)O // array buffer offset 


» 


// 2nd attribute buffer : positions of particles' centers 
glEnableVertexAttribArray(1); 

glBindBuffer(GL ARRAY BUFFER, particles position buffer); 

glVertexAttribPointer( 

1, // attribute. No particular reason for 1, but must match the layout in the shader. 
4, // size : X + y + Z + size => 4 

GL FLOAT, // type 

GL FALSE, // normalized? 

0, // stride 

(void*)O // array buffer offset 


ye 


// 3rd attribute buffer : particles’ colors 
glEnableVertexAttribArray(2); 
glBindBuffer(GL ARRAY BUFFER, particles color buffer); 
glVertexAttribPointer( 

2, // attribute. No particular reason for 1, but must match the layout in the shader. 

4, // size: r -* g * b+a => 4 

GL UNSIGNED BYTE, // type 

GL TRUE, // normalized? *** YES, this means that the unsigned char[4] will be accessible 
0, // stride 

(void*)O // array buffer offset 


): 
BJ 


绘制 方法 与 以 往 有 所 不 同 。 这 次 不 使 用 glDrawArrays EX glDrawElements (如 果 原 始 网 格 有 index 
buffer 的 话 ) 。 这 次 用 的 是 glDrawArraysInstanced 或 者 glDrawElementsInstanced ， 效 果 等 同 于 调 
用 glDrawArrays NR 〈N 是 最 后 一 个 参数 ， 此 例 中 即 ParticlesCount ) 。 





glDrawArraysInstanced(GL TRIANGLE STRIP, 0, 4, ParticlesCount); 


有 件 事 差 点 忘 了 。 我 们 还 没 告诉 OpenGL 哪 个 buffer 是 原始 网 格 ， 哪 些 buffer 是 各 实例 的 特性 。 调 
用 glvertexAttribDivisor 即 可 完成 。 有 完整 注释 的 代码 如 下 : 


// These functions are specific to glDrawArrays*Instanced*. 


// The first parameter is the attribute buffer we're talking about. 

// The second parameter is the "rate at which generic vertex attributes advance when rend 
// http://www.opengl.org/sdk/docs/man/xhtml/glVertexAttribDivisor.xml 
glVertexAttribDivisor(0, 0); // particles vertices : always reuse the same 4 vertices -> 
glVertexAttribDivisor(1, 1); // positions : one per quad (its center) -> 1 
glVertexAttribDivisor(2, 1); // color : one per quad -> 1 


// Draw the particules ! 

// This draws many times a small triangle strip (which looks like a quad). 
// This is equivalent to : 

// for(i in ParticlesCount) : glDrawArrays(GL TRIANGLE STRIP, 0, 4), 

// but faster. 

glDrawArraysInstanced(GL TRIANGLE STRIP, 0, 4, ParticlesCount); 


eo O Oo 


如 你 所 见 ，instancing 是 很 灵活 的 ， 你 可 以 料 AttribDivisor 设 为 任意 整数 。 例 
如 ，'glVertexAttribDivisor(2, 10)' 即 设置 后 续 10 个 实例 都 拥有 相同 的 颜色 。 





意义 何在 ? 


意义 在 于 如 今 我 们 只 需 在 每 帧 中 更 新 一 个 很 小 的 buffer (粒子 中 心 位 置 ) ， 而 非 整 个 网 格 。 如 此 一 来 ， 带宽 
利用 效率 提升 了 4 倍 。 
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于 场景 中 其 它 对 象 不 同 的 是 ， 粒 子 的 生死 更 替 十 分 频繁 。 我 们 得 用 一 种 速度 相当 快 的 方式 来 创建 新 粒子 ， 
抛弃 旧 粒 子 。 new Particle() 这 种 办 法 显然 不 够 好 。 


创建 新 粒子 


首 乞 得 创建 一 个 大 的 粒子 容器 : 


// CPU representation of a particle 
struct Particle{ 
glm::vec3 pos, speed; 
unsigned char r,g,b,a; // Color 
float size, angle, weight; 
float life; // Remaining life of the particle. if < © : dead and unused. 


Ie 


const int MaxParticles = 100000; 
Particle ParticlesContainer[MaxParticles]; 


接 下 来 ， 我 们 得 想 办 法 创建 新 粒子 。 如 下 的 函数 在 ParticleContainer 中 线性 搜索 ( 听 起 来 有 些 暴 力 ) 新 
粒子 。 不 过 ， 它 是 从 上 次 已 知 位 置 开 始 搜 索 的 ， 因 此 一 般 很 快 惑 返回 了 。 


int LastUsedParticle = 0; 


// Finds a Particle in ParticlesContainer which isn't used yet. 
// (i.e. life < 0); 
int FindUnusedParticle(){ 


for(int 1=LastUsedParticle; i«MaxParticles; i++){ 
if (ParticlesContainer[i].life < 0){ 
LastUsedParticle = 1; 
return 1; 


for(int 1=0; i<LastUsedParticle; i++){ 
if (ParticlesContainer[i].life < 0){ 
LastUsedParticle = 1; 
return 1; 


return 0; // All particles are taken, override the first one 


现在 我 们 可 以 把 ParticlesContainer[particleIndex] 当中 的 life. color. speed 和 position 3% 
置 成 一 些 有 趣 的 值 。 欲 知 详情 请 看 代码 ， 此 义 大 有 文章 可 作 。 我 们 比较 关心 的 是 每 一 帧 中 要 生成 多 少 粒 
子 。 这 跟 具 体 的 应 用 有 天， 我 们 融 设 为 每 秒 10000 个 (RR, BSI) 新 粒子 好 了 : 


int newparticles = (int)(deltaTime*10000.0); 


记得 把 个 数 限 定 在 一 个 固定 范围 内 : 


// Generate 10 new particule each millisecond, 
// but limit this to 16 ms (60 fps), or if you have 1 long frame (1sec), 
// newparticles will be huge and the next frame even longer. 
int newparticles = (int)(deltaTime*10000.0); 
if (newparticles > (int)(0.016f*10000.0)) 
newparticles - (int)(0.016f*10000.0); 


删除 旧 粒 子 


这 个 需要 一 些 技巧 ， 参 见 下 文 =) 
仿真 主 循环 


ParticlesContainer 同时 容纳 了 “活着 的 "和 “死亡 的 "粒子 ， 但 发 送 到 GPU 的 buffer 仅 含 活着 的 粒子 。 


所 以 ， 我 们 要 通 历 每 个 粒子 ， 看 它 是 否 是 活着 的 ， 是 否 应 该 "处死 "。 如 果 一 切 正 常 ， 那 束 添 加 重力 ， 最 后 将 
其 拷贝 到 GPU 上 相应 的 buffer 中 。 


// Simulate all particles 
int ParticlesCount = 0; 
for(int 1=0; i«MaxParticles; it+){ 
Particle& p = ParticlesContainer[i]; // shortcut 


if(p.life > 0.0f){ 


// Decrease life 
p.life -= delta; 


if (p.life > 0.0f){ 


// Simulate simple physics : gravity only, no collisions 

p.speed += glm::vec3(0.0f,-9.81f, 0.0f) * (float)delta * 0.5f; 

p.pos += p.speed * (float)delta; 

p.cameradistance = glm::length2( p.pos - CameraPosition ); 
//ParticlesContainer[i].pos += glm::vec3(0.0f,10.0f, 0.0f) * (float)delta; 


// Fill the GPU buffer 

g particule position size data[4*ParticlesCount-*0] = p.pos.x; 
g particule position size data[4*ParticlesCount-1] = p.pos.y; 
g particule position size data[4*ParticlesCount+2] = p.pos.z; 


g particule position size data[4*ParticlesCount+3] = p.size; 


g particule color data[4*ParticlesCount-*0] = 
g particule color data[4*ParticlesCount-*1] 
g particule color data[4*ParticlesCount-*2] = 
g particule color data[4*ParticlesCount-3] 
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telse{ 
// Particles that just died will be put at the end of the buffer in SortParti 
p.cameradistance = -1.0f; 


ParticlesCount++; 
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排序 


正如 [第 十 课 ][1] 中 所 讲 ， 你 必须 按 从 后 往 前 的 顺序 对 半 透 明 对 象 排序 ， 方 可 获得 正确 的 混合 效果 。 


void SortParticles()( 
std: :sort(&ParticlesContainer[0], &ParticlesContainer[MaxParticles]); 


std::sort 需要 一 个 函数 判断 粒子 的 在 容器 中 的 先后 顺序 。 重 载 Particle::operator< 即 可 : 


struct Particle{ 


bool o 


perator<(Particle& that) { 
return this->cameradistance > that.cameradistance; 


jg 


这 样 ParticleContainer PMF mAIEBSERFEBJI, BORE SIS : 
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你 可 以 用 纹理 图 集 (texture atlas) 实现 粒子 的 动画 效果 。 将 各 粒子 的 年 龄 和 位 置 发 送 到 GPU， 按 照 [2D 字 
体 一 课 ][2] 的 方法 在 shader 中 计算 UV 坐标 ， 纹 理 图 集 是 这 样 的 : 


X 
x 
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义理 多 个 粒子 系统 


如 果 你 需要 多 个 粒子 系统 ， 有 两 种 方案 可 选 : 要 么 仅 用 一 个 粒子 容器 ， 要 么 每 个 粒子 系统 一 个 。 

如 果 选 择 将 所 有 粒子 放 在 一 个 容器 中 ， 那 么 就 能 很 好 地 对 粒子 进行 排序 。 主 要 缺陷 是 所 有 的 粒子 都 得 使 用 
同一 个 纹理 。 这 个 问题 可 借助 纹理 图 集 加 以 解决 。 纹 理 图 集 是 一 张 包含 所 有 纹理 的 大 纹理 ， 可 通过 UV 坐标 
访问 各 纹理 ， 其 使 用 和 编辑 并 不 是 很 方便 。 

如 果 为 每 个 粒子 系统 设置 一 个 粒子 容器 ， 那 么 只 能 在 各 容器 内 部 对 粒子 进行 排序 。 这 就 导致 一 个 问题 : 如 
果 两 粒子 系统 相互 重 受 ， 我 们 就 会 看 到 瑕 辛 。 不 过 ， 如 果 你 的 应 用 中 不 会 出 现 两 粒子 系统 重合 的 情况 ， 那 
RARE iv] BA. 

当然 ， 你 也 可 以 采用 一 种 混合 系统 : 若干 个 粒子 系统 ， 各 自 配 各 纹理 图 集 (足够 小 ， 易 于 管理 ) 。 

平滑 粒子 


你 很 快 束 能 发 现 一 个 党 见 的 瑕 疙 : 当 粒 子 和 几何 体 相交 时 ， 粒 子 的 边界 变 得 很 明星， 十 分 难看 : 





(image from http://www.gamerendering.com/2009/09/16/soft-particles/ ) 
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然而 ， 这 就 需要 对 Z-Buffer 进 行 采 样 。 这 在 “正常 "的 Z-Buffer 中 是 不 可 行 的 。 你 得 将 场景 泻 染 到 一 个 [ 泻 染 目 
标 ][3]。 或 者 ， 你 可 以 用 giBlitFrameBuffer 把 Z-Buffer 内 容 从 一 个 帧 缓冲 拷贝 到 另 一 个 。 


http://developer.download.nvidia.com/whitepapers/2007/SDK10/SoftParticles hi.pdf 
he rH De 
当前 GPU 的 一 个 主要 限制 因素 就 是 填充 率 : 在 16.6ms 内 可 写 片 段 (像素 ) 数量 要 足够 多 ， 以 达到 60FPS。 


这 是 一 个 大 问题 。 由 于 粒子 一 般 需 要 很 高 的 填充 率 ， 同 一 个 片段 要 重复 绘制 10 多 次 ， 每 次 都 是 不 同 的 粒 
Fo MWR TZA, RAAR R H N ERRE 
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全 透明 的 ， 但 粒子 的 网 格 却 仍然 得 绘制 这 些 无 用 的 片段 ， 然 后 用 与 之 前 完全 相同 的 值 更 新 颜色 缓冲 。 


这 个 小 工具 能 够 计算 纹理 的 紧 凌 包围 网 格 (这 个 也 就 是 用 glDrawArraysInstanced() 温 染 的 那个 网 格 ) 





[http://www.humus.name/index.php?page=Cool&ID=8][4]。Emil Person 的 网 站 上 也 有 很 多 精彩 的 文章 。 


粒子 物理 效果 
有 些 应 用 中 ， 你 可 能 想 让 粒子 和 世界 产生 一 些 交互 。 比 如， 粒子 可 以 在 撞 到 地 面 时 反弹 。 


比较 简单 的 做 法 是 为 每 个 粒子 做 光线 投射 (raycasting) ， 投 射 方 向 为 当前 位 置 与 未 来 位 置 形 成 的 向 量 。 我 
们 将 在 [拾取 教程 5]。 但 这 种 做 法 开销 太 大 了 ， 你 没 法 做 到 在 每 一 帧 中 为 每 个 粒子 做 光线 投射 。 


根据 你 的 具体 应 用 ， 可 以 用 一 系列 平面 来 近似 几何 体 (译注 : k-DOP) ， 然 后 对 这 些 平面 做 光线 投射 。 你 
也 可 以 采用 真正 的 光线 投射 ， 将 结果 缓存 起 来 ， 然 后 据 此 近似 计算 附近 的 磁 撞 (也 可 以 兼用 两 种 方法 ) o 


另 一 种 锭 异 的 技术 是 将 现 有 的 Z-Buffer 作 为 几何 体 的 粗略 近似 ， 在 此 之 上 进行 粒子 碰撞 。 这 种 方法 效果 "“ 足 
够 好 "”， 速 度 快 。 不 过 由 于 无 法 在 CPU 端 访问 Z-Buffer( 至 少 速度 不 够 快 )， 你 得 完全 在 GPU 上 进行 仿真 。 
此 ， 这 种 方法 更 加 复杂 。 


如 下 是 一 些 相关 文章 : [http://www.altdevblogaday.com/2012/06/19/hack-day-report/][6] 


[http://www.gdcvault.com/search.phpz&category-free&firsttocus-&keyword-Chris- Tchou's9o2BHalo962B 
Reach™%2BEffects&conference_id=]|7] 


GPU 仿真 


如 上 所 述 ， 你 可 以 完全 在 GPU 上 模拟 粒子 的 运动 。 你 还 是 得 在 CPU 病 管 理 粒 子 的 生命 周期 一 一 至 少 在 创建 
粒子 时 。 


可 选 方案 很 多 ， 不 过 都 不 属于 本 课程 讨论 范围 。 这 里 仅 给 出 一 些 指引 。 


e 采用 变换 反馈 (Transform Feedback) 机 制 。Transform Feedback 让 你 能 够 将 顶点 着 色 器 的 输出 结果 
存储 到 GPU 端的 VBOo 中 。 把 新 位 置 存 储 到 这 个 VBO， 然 后 在 下 一 帧 以 这 个 VBO 为 起 点 ， 然 后 再 将 更 新 
的 位 置 存储 到 前 一 个 VBO 中 。 原理 相同 但 无 需 Transform Feedback 的 方法 : 将 粒子 的 位 置 编 码 到 一 张 
纹理 中 ， 然 后 利用 泻 染 到 纹理 (Render-To-Texture) 更 新 之 。 

e 采用 通用 GPU 计算 库 : CUDA 或 OpenCL。 这 些 库 具有 与 OpenGL 互 操作 的 函数 。 

。 采用 计算 着 色 器 Compute Shader。 这 是 最 漂 完 的 解决 方案 ， 不 过 只 在 较 新 的 GPU 上 可 用 。 


请 注意 ， 为 了 简化 问题 ， 在 本 课 的 实现 中 ParticleContainer 是 在 GPU buffer 都 更 新 之 后 再 排序 
的 。 这 使 得 粒子 的 排序 变 得 不 准确 了 〈 有 一 帧 的 延迟 ) ， 不 过 不 是 太 明 显 。 你 可 以 把 主 循环 拆 分 成 仿 
真 、 排 序 两 部 分 ， 然 后 册 更 新 ， 就 可 以 解决 这 个 问题 。 


